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Human PKHD1 coding sequence 



ATGACTGCCTGGCTGATCTCTCTGATGAGTATTGAAGTACTACTTTTGGCAGTACGTCACCTGAGTTTA 
CATATTGAACCTGAAGAAGGTAGCCTTGCAGGGGGAACGTGGAT C ACAGT CATTTTTGATGGTTTGGAG 
TTGGGTGTTCTTTACCCCAACAATGGCTCTCAATTGGAGATACACCTGGTGAACGTGAACATGGTGGTG 
CCCGCACTGCGGAGTGTTCCCTGTGACGTCTTTCCTGTTTTCTTGGATTTGCCTGTGGTGACATGCCGG 
AC CAGATCTGTGCTGTCTGAAG CACATGAGGGTCTGTACTTCCTGGAAGCAT ACTT CGGGGGACAG CTG 
GTAAGGAGTCCAAATCCAGGACCACGAGATAGCTGTACTTTCAAGTTTTCCAAGGCGCAGACACCCATC 
GTT CACCAAGTTTATCCACCAAGTGGTGTT CCAGGAAAACTAATACATGTATATGGCTGGATTATCACT 
GGAAGATTGGAAACTTTTGATTTTGATGCTGAGTACATTGATAGCCCAGTGATCTTGGAAGCTCAAGGA 
GACAAATGGGTTACTC CTTGCTCTCTTATAAAT AGGCAGATGGGAAGCTGTTATC CTATT CAGGAGGAC 
C ATGGT CTTGGGACTCTGCAGTGC CATGTGGAAGGCGACTACATCGGCTCC CAGAATGTTAGCTTCTCA 
GTATTT AACAAAGGAAAGT CAATGGT CCACAAGAAGGCATGGCTGATCAGTGCTAAACAGGATCTTTTC 
CT ATACCAGACACACTC AGAAATATTAT CTGTGTTT C CAGAAACTGGGAGC CTTGGGGGAAGAACAAAC 
ATCACAATTACAGGAGACTTTTTTGACAATTCTGCCCAGGTTACCATTGCAGGCATTCCATGTGATATT 
AGACACGTGTCT CCCAGGAAGATTGAGTGCAC C ACT CGGGCTCCAGGAAAAGATGTGAGGCT CAC CACC 
CCTCAGCCAGGCAATCGAGGGCTTCTTTTTGAAGTTGGAGATGCTGTTGAGGGACTGGAACTGACTGAA 
GCCACCCCAGGGTACAGGTGGCAGATTGTCCCTAATGCCAGTTCTCCATTTGGGTTTTGGTCACAGGAA 
GGACAACCTTTCAGAGCACGGCTCAGTGGGTTCTTTGTGGCTCCAGAGACAAATAATTACAC 
ATTCAGGCAGATAGCCAAGCTT C CTTGCATTTCAGTTGGTCAGAGGAACG?VAGGACTAAGGTGAAAGTG 
GCCTCCATCAGCGTCGGCACTGCTGACTGGTTTGACTCCTGGGAGCAGAATAGGGATGAAGGGACCTGG 
CAGCAGAAGACTCCCAAGTTGGAGCTGTTGGGTGGAGCCATGTACTACCTGGAAGCAGAGCATCATGGG 
AT AGC C C CAAGCAGGGGGATGAGGATTGGTGTCCAGATTCACAACAC CTGGC TGAATCCTGATGTGGTC 
ACCACTTACCTACGGGAGAAGCAC CAGATCCGAGTCCGAGC CCAGAGGCTTCC AGAAGTACAGGTGCTG 
AATGTATC AGGC AGAGGAAACTTCTT CCTTACTTGGGACAATGT CT CTAGT CAGCCAATC C CTGCAAAT 
GC CACAGC C CAT CTGATT CAAAC AAC CATTGAGGAGTTACTTGCAGT AAAATGCAAACTGGAAC C CCTT 
TGGTCTAACATCCTTCTCCGGCTTGGATTTGAACGAGGCCCAGAAGTTTCCAACTCTGATGGGGACCTC 
ACCAGTGGGACGGAGCCCTTCTGTGGCAGGTTCAGCCTCCGTCAGCCTCGACACCTTGTCCTTACTCCC 
C CGGCTGCCCAGAAGGGCTATCGGCTAGAT CAGTATACACAC CTGTGT CTTGCATACAAAGGCCACATG 
AACAAGATC CTGAAGATGATTGTGTCCTT CACAATCGGCTTTCAAAACATGGTAAAGAATAC CAC CTGT 
GACTGGAGTCTCACGAGGACCAGCCCCGAGAGCTGGCAGTTCGATTGCACTGACCTCTGGGAGACTTGT 
GTGCGTTGCTTCGGGGATCTCCAGCCCCCTCCGGCAAACTCCCCAGTGCTGGTTCATCAGATCAACCTT 
CTCCCTCTGGCCC^GGAGACGGGCCTGTTCTATGTGGATGAAATTATTATTGCA.GACAC^AACGTAACA 
GTTTCTCAAGCTGATTCTGGAACGGCTCGCCCAGGGGGCAATCTGGTGGAATCAGTCTCTGTGGTGGGA 
TCCCCTCCGGTCTACAGTGTCACCTCCTGGCTGGCGGGGTGTGGCACGGAGCTCCCGCTCATCACTGCA 
CGCTCTGTGCCC ACTGAAGGAAC AGAAGAGGGAT CTGGACTGGT C CTGGTGACGACACAGAGACGACAG 
CGGACAAGT CCACCTCTAGGAGGACACTTTCGCAT CCAGCTT CCT AAT ACAGTGATTT CTGATGTC C CT 
GTAC AAATTTCTGCT CATCACCTTCACCAGCT CTTACAGAATAATGCCGATGACTT C AC ATCCAGGTAC 
CTCAATGCCAGTGACTTCACTGTGAAGGAGGATCTATACACTTGCTACGAACACGTGTGGACCTTGTCC 
TGGTCCACTCAGATTGGGGATTTGCCCAATTTTATCAGGGTCTCTGATGAAAACCTTACTGGAGTGAAT 
CCTGCTGCAGCCACGCGTGTGGTATATGATGGTGGAGTTTTTCTTGGACCCATATTTGGAGACATGTTG 
GCTACTGCCAACCAGCATACTCAGGTGGTTGTGCGAGTGAATGATGTACCAGCTCATTGCCCAGGTTCC 
TGCTCTTTCCAGTACCTCCAAGGGTCAACTCCCTGTGTCCATTCTGTGTGGTACTCCATTGATGGTGAC 
ATCAACCTAATGATTTACATTACCGGAACTGGTTTCTCTGGTGACTCCCAGTTCTTGCAGGTTACAGTG 
AACAAAACGAGTTGCAAAGTTATTTTCTCAAAC CAGACCAATGTAGT CTGTCAGACAGATTTGC TACCT 
GTTGGAATGCATCGGAT CTTGATGTTGGTGAGAC C CT CTGGTCTTGCCAT C AGTGCCACTGGAGAAGAC 
CT CTTCCTAAATGTGAAACCTAGACTGGAT ATGGTGGAGCCTT CCAGAGCTGCGGATATTGGAGGGCTC 
TGGG CCACCAT C CGAGGCT CT AGTTTGGAAGGTGTTAGCCTGATATT ATTTGGAT CTTACT CGTGTGC C 
AT CAATGTCGCTACAAGCAATTCAAGCAGAATT C AGTGCAAAGTTC CACCCAGGGGGAAAGATGGACGC 
ATTGTGAATGTGACTGTGATCAGAGGGGACTATTCTGCAGTTCTTC C CAGAGCATTT ACAT ATGTCT CT 
T C CTTAAATCCAGTTATTGTGACT CTGAGCAGAAACATAAGCAATATAGCAGGCGGTGAGACC CTGGT C 
ATTGGAGTGGCGAGGCTGATGAACTATACGGATTTGGATGTGGAAGTC CACGT C CAGGATGC CTTGGC T 
CCGGTTCACACACAGTCGGCTTGGGGCCTGGAGGTGGCACTGCCCCCACTGCCAGCTGGTCTCCACAGA 
ATTTCCGTCTCTATCAATGGGGTCAGCATTCACTCACAAGGGGTTG^ 

GAAGTTTTCAGCATCGAGCCTTGCTGTGGGTCCCTGCTGGGAGGGACCATCCTCAGCATCTCAGGAATA 
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GGCTTCAGCAGGGACCCAGCTTTGGTTTGGGTACTTGTGGGCAATCGGTCCTGTGACATTGTGAACTTA 

ACGGAGGCGAGCATCTGGTGTGAAACCCTGCCAGCCCCCCAGATACCCGATGCGGGCGCTCCCACTGTT 

CCAGCTGCCGTGGAGGTCTGGGCTGGCAACAGGTTCTTCGCCCGTGGTCCTTCACCAAGCTTGGTGGGG 

AAAGGCTTCACCTTCATGTATGAAGCGGCAGCAACACCAGTAGTCACTGCCATGCA^ 

AATAGCAGCCTGAGCCTGCATGTGGGAGGAAGTAACCTCTCCAACTCAGTCATCCTTCTGGGGAACCTG 

AACTGTGATGTTGAGACACAGT C CTTC CAGGGCAACGTGAGCCTGTCTGGATGCTCCAT C CCTCTT CAC 

AGTCTGGAGGCTGGCATCTAT CCT CTC CAAGTACGTCAGAAGCAGATGGGATTTGCTAATATGTCTGTG 

GTGCTCCAGCAATTTGCAGTGATGCCTCGGATAATGGCCATCTTCCCATCGCAGGGTTCGGCATGTGGT 

GGGAC CATACTTACTGTGAGGGGGTTGCTT CTTAACTCTAGAAGGAGGT CAGTTCGGGTTGACCTCTCG 

GGTCCTTTTACTTGTGTGATTTTGAGTTTGGGAGACCACACCATTCTCTGCCAGGTTAGCCTGGAGGGT 

GACCCCT TGCCTGGAGCTT C CTT CTCC CTGAACGT CACAGT C CTGGTCAATGGGCTAACCAGCGAGTGT 

G AGGGGAATTGCACTCTTTT CATAAGGGAAGAGGCAAGT C CTGTCATGGATGCCTTGT C CACAAACACC 

AGTGGGTCTCTGACCACTGTGCTGATTAGGGGTCAGAGGTTAGCCACCACAGCTGATGAGCCGATGGTA 

TTTGTGGATGATCAACTTCCTTGCAATGTAACTTTTTTTAATGCAAGCCACGTTGTGTGCCAGACAAGA 

GACTTGGCCCCAGGACCCCACTACCTGTCAGTTTTTTATACAAGAAATGGGTATGCTTGTTCTGGTAAT 

GTTTCCAGACACTTCTACATTATGCCCCAAGTGTTTCATTATTTTCCTAAGAATTTCAGCTTACATGGT 

GGAAGCCTCTTGACCATAGAGGGGACAGGCCTGAGAGGACAGAACA^ 

CAGACCTGCCTGACGGTGAACAT CGGTGCTGAGCTCAT CCGGTGCATTGTT CC CACAGGGAATGGCTCT 
GTTGCCCTGGAAATAGAGGTAGATGGACTTTGGTATCACATAGGAGTCATTGGTTATAACAAGGCCTTT 
AC CCCAGAATTGATCT CTATTTCT CAGAGCGATGACAT CTTAAC CTTTGCAGTGGCCCAGATCTCAGGA 
GCTGC AAACATTGACATTTTTAT AGGAATGT CACCCTGTGTGGGTGT CT CTGGTAACCACACCGTTCTT 
CAGTGCGTGGTCCCTTCCCTTCCGGCCGGGGAGTACCACGTCAGAGGCTATGACTGCATCAGAGGGTGG 
GCCTCATCTGCCCTGGTGTTCACCTCAAGAGTTATTATTACAGCAGTGACGGAGAACTTCGGCTGCCTG 
GGTGGAAGGCTGGTGCATGTGTTTGGAGCGGGATTTTCTCCAGGGAATGTCTCAGCTGCTGTGTGTGGT 
GCTCCCTGCCGAGTCCTGGCTAATGCTACAGTGTCTGCCTTGAGCTGCTTGGTTCTGCCCCTGGATGTG 
TCCTTGGCCTTCCTGTGTGGCCTGAAGCGTGAGGAGGACAGCTGTGAGGCTGCCAGACACACCTATGTG 
CAGTGTGATTTGACAGTTGCCATGGCGACAGAGCAACTGCTTGAATCGTGGCCTTACCTCTACATTTGC 
GAGGAAAGTTC CCAATGCCT CTTTGTGC CAGATCATTGGGCAGAGT C AATGTTT CCATCATT CTCGGGC 
CTCTTTATCAGCCCTAAATTGGAAAGAGATGAAGTTCTCATCTATAATAGCTCCTGTAACATTACCATG 
GAAACTGAGGCAGAGATGGAGTGTGAGACGCCCAATCAGCCAATTACCGTCAAGATTACTGAGATACGG 
AAACGCTGGGGCGAGAAGACTCAGGGCAACTTTTCTTTAGAGTT 

. AGCTGGTTTCCTGAAAGGCTGC CACAAGATGGCGACAACGTCACAGTGGAGAATGGCCAATTGCTT CTG 
CTGGACACTAACACAAGCATCCTCAACTTACTGCACATTAAAGGGGGCAAGCTGATTTTC^ 
GGACC CATCGAGCT CAGGG CAGACGCCATCCTTGTTT CTGATGGTGGAGAGCT C CGGATTGGAT CCGAA 
GACAAGCCCTTCCAAGGCAGAGCTCAGATCACACTCTACGGGAGTTCCTACTCAACTCCCTTCTTTCCC 
TATGGAGTCAAGTT CCTGGCTGTGAGGAATGGAACT CTTTCT CTGCACGGTT CACTACCAGAAGTAATT 
GTCACCTGTCTTAGAGCAACTGCCCATGCCCTAGACACAGTGCTGGCTTTAGAAGATGCTGTGGACTGG 
AACC CTGGGGATGAAGTTGTCAT CATCAGTGGAACAGGTGTTAAAGGTGC CAAACCGATGGAAGAGAT T 
GTCACTGTGGAAACTGTGCAGGATACAGACCTCTAT CTTAAGT CACCTTTGAGATATTCT CACAACTTT 
AGAGAGAATTGGGTGGCTGGAGAGCACCATATTTTAAAGGCCACTGTGGCTCTGCTCAGCAGGAGTATT 
AC CATAC AAGGAAAT CT CACTAATGAGAGGGAGAAGCTGCTTGTTT CATGC CAGGAGGCCAATGCTC CA 
GAAGGTAAT CTGCAGCACTGTTTGTATTC CATGAGTGAGAAGATGCTAGGAT CCAGGGATATGGGAGC C 
AGAGTGATCGTTC AGTCCTTCC CAGAAGAGC C CAGC CAGGTCCAGTTGAAGGGAGTGCAGTTTCAAGTC 
TTGGGGC AAGC CTT CCATAAGCATCTGAGCTCACT CACT CTGGTGGGAGCTATGAGAGAGTCTTT CATA 
CAGGGCTGCACAGTGAGGAACTCCTTCAGTAGAGGCCTCAGCATGTGCGGGACCTTGGGCCTGAAGGTG 

. GAC^GTAATGTATTCTACAATATTTT^ 

AT CT C CTGGGAGGCAATTCATGGAAGGAAAGATGACTGGT CAGGACATGGAAAT ATAATAAGAAACAAC 

. jstgatcatccaggtttctggtgccgagggactctccaatcctgaaatgttgacacc at ctggcat ctat 
. atdtgcagtc ccac caatgttatagaggggaacagagtgtgtggtgctggctatggctactttttc cat 
x}tcatgacg^ccaaacatcacaagctccgcttcttt^ 

aggtatggt ctctttgtatacc ctaaatttcagccac cttgggataatgt cactggcaccactctgttc 
cagagcttca^gtttgggaaagtgc^^^ 

i^ctt gaaagtttatt c atgcagagattttggaa cagtt 

ACTGAC^GCTTATTACTTGGTC^^ 

CCTAAAAGATGGGAACTGATGGTGTCTAACACAACCTTTGTTAATTTTGATCTCATCAACTGTGTGGCC 
ATTAGAACCTGTTCAGACTGTTCCCAAGGAC^AGGTGGATTTACTGTGAAGACCAGCCAGTTGAAGTTT 
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ACAAACTCTTCAAACTTAGTGGCATTTCCATTTCCTCATGCAGCAATTTTGGAAGACTTGGATGGGTCT 

CTGTCTGGGAAAAACAGAAGTCACATTCTTGCTTCTATGGAAACCCTTTCAGCTTCTTGTTTGGTCAAT 

TCAAGCTTTGGTCGGGTTGTCCATGGCAGTGCCTGTGGAGGAGGTGTTCTTTTTCATCGTATGTCTATT 

GGTTTAGCGAATACTCCTGAAGTTTCTTATGATTTAACCATGACTGACAGCAGAAATAAAACAACCACT 

GTCAATTATGTACGTGATACATTGTCTAACCCTCGTGGCTGGATGGCTCTGCTCTTGGACCAAGAGACC 

TACTCATTGG^TCTGAGAACCTTTGGATCAACAGATCTCTGCAGTACTCAGCAACCTTTGACAACTTT 

GCTCCTGGTAATTACCTACTGCTGGTGCACACAGATTTGCCGCCTTACCCTGACATCCTCCTAAGATGT 

GGGAGTCGAGTGGGTCTGTCTTTTCCATTTCTTCCATCACCAGGTCAGAACCAAGGCTGTGACTGGTTC 

TTCAATAGCCAGCTGAGGCAACTCACCTATCTGGTTTCAGGTGAAGGCCAAGTTCAAGTCATTCTCCGG 

GTGAAGGAAGGTATGC C C CCAACT ATTT CAGCTTCTACCTCTGCCC CTGAATCAGCTTTAAAATGGT CC 

CTCCCTGAAACATGGCAAGGTGTTGAAGAAGGCTGGGGAGGATACAACAATACCATTCCAGGCCCTGGG 

GATGACGTTCTCATTTT ACCCAACAGAACTGTC CTTGTGGATACAGAT CTT C CATT CTT CAAAGGGCTG 

T ATGTGATGGGGACCTTAGACTTCCCTGTGGACAGAAGCAATGT TCTGAGTGTGGCATGC ATGGT CATT 

GCAGGCGGGGAGCTGAAAGTTGGTACTTTAGAAAATCC CTT AGAAAAGGAACAAAAGCTTCTGATT CTC 

C TTAGAGC CTCAGAGGGAGTCTTTTGTGACCGTATGAATGGAATT CAT ATTGACCCAGGAACAATTGGG 

GTTTATGGGAAAGTTCAT CTTTACAGTGCTTATC CTAAGAACTCCTGGACACATCTTGGAGCTGATATT 

GCCTCAGGAAATGAGAGAATTATAGTAGAAGATGCAGTGGATTGGCGCCCCCATGACAAAATAGTCCTT 

AGCTCCTCTTCTTATGAGCCTCATGAAGCAGAGGTCCTCACTGTGAAAGAAGTCAAGGGCCACCATGTG 

AGGAT CTATGAACGGCT CAAACACCGGCATATTGGAAGTGTACATGTCACGGAGGATGGC CGACACATT 

CGTTTGGCTGCTGAGGTTGGACTGTTGACCCGAAATATACAAATTCAGCCTGACGTATCATGTAGGGGG 

AGACTGTTTGTGGGGT C CTT CAGGAAGTC CAGCCGAGAAGAATTTTCAGGTGTCCTTCAAC TT CTTAAT 

GTGGAAATTCAGAACTTCGGGTCACCATTGTACT CAT CTGTTGAATT CAGTAATGTGT CAGCAGGAT CC 

TGGAT CAT ATCAT CT ACTCTGCAC CAGAGCTGTGGCGGGGGCATT CATGCAGCTGC CAGT C ATGGAGTA 

CTTTTAAATGACAATATTGTGTTTGGCACAGCTGGCCATGGCATAGATTTAGAGGGTCAGGCCTATACT 

GTC ACTAATAACCTTGTGGTTCTGATGACACAGCCAGCGTGGT C CAC C ATTTGGGTGGCGGGAAT C AAA 

GTGAACCAGGTAAAGGACAT CAAC CT CCATGGCAACGTTGTGGCAGGATCAGAGAGACTTGGCTTTCAC 

ATCCGAGGCCACAAGTGCTCCTCTTGTGAACTGCTTTGGTCTGAG^ 

GGCCTTCATCTCTATAAGGAAAGTGGACTTGACAACTGTACCAGAATCTCTGGCTTCTTGGCTTTCAAG 
AACTTTGACTATGGTGCCATGTTACATGTAGAGAACAGCGTGGAGATAGAGAACATTACTCTGGTAGAC 
AATACTATTGGTCTTTTGGCAGTAGTGTATGTATTTT CTGCT C CACAAAATTCCGTCAAAAAAGTGCAG 
ATTGTGCTTAGGAATTCAGTGATTGTGGCCACGAGCTCTTCT 

CCGC ACTCAGCCAACTTGAC AT CAACAGATAGAGCT C CCTCC AATC CAAGAGGAGGTCGAATTGGTATT 
CTGTGGCCTGT AT TCAC CTCAGAACCAAATCAGTGGCCTCAGGAGCCATGGCACAAAGTGAGGAATGAT 
CATTCAATTT CAGGAAT C ATGAAACTTCAAGATGTTAC CTTTTCTAGTTTTGTGAAGAGTTGCTATAGC 
GATGACCTGGATGTCTGCATTCTACCAAATGCAGAGAACAGTGGAATTATGCACCCAATAACAGCAGAG 
AGGACCAGGATGCTAAAGATAAAAGATAAAAACAAGTTCTACTTTC CTT CATTACAAC CC AGGAAAGAT 
TTAGGAAAAGTAGT CTGT CCTGAATTAGACTGTGCAAGTCCAAGAAAATATCTCTTC AAGGATCTGGAT 
GGGAGAGCCCTGGGTCTGCCTCCACCAGTTTCTGTATTTCCTAAAACAGAGGCAGAATGGACTGCATCC 
TTCTT CAACGCAGGTACATTTAGAGAAGAACAGAAATGTACATACCAATTT CTGATGC AAGGATTCAT C 
TGCAAACAGACTGACCAAGTGGTCCTAATTCTTGATAGCGCTGATGCCATTTGGGCAATTCAGAAGTT^ 
TAT C CAGTTGTAT CTGTGACTAGTGGTTTTGTTGATGT CTTTAGCAGTGTAAATGCCAATATT CCCTGC 
TCTACTTCTGGGT C AGTGT CTACTTTCTATT CTAT CTTACCCATC AGGCAAATCACCAAAGT CTGCTTC 
ATGGATCAAACTCCTCAAGTTTTGCGCTTTTTTCTATTGGGGAACAAAAGTACCTCCAAGCTTCTCTTG 
GCTGTATTCT ACCATGAGCT CCAGAGCCCCCACGTCTT CTTAGGGGAAAGTTTTATT C CAC CCACT CTG 
GTTCAGT CAGCTT C CTTATTGCTGAATGAATCTATTGGTGCC AACTATTTCAACATCATGGATAAC CT C 
TTGTATGTTGTCCTACAAGGAGAGGAGCCCATTGAAATACGCTCAGGTGTTTCCATTCACTTGGCCCTC 
ACTGTGATGGTTTCAGTCTTAGAAAAAGGCTGGGAAATAGTAATACTCGAAAGACTAACTAACTTCTTA 
CAGATTGGCCAAAACCTVAATCAGGTTTATT^ 

GCTGACAGTAGAGCAAAAAGAAAGCGCAATTGCCCTACTGTGACTTG^C^ 

GGTCAACGTAGGCCT CTCATGATGGAAATGAACTCACATAGGGCTTCACC CCCAATGACTGTGGAAACT 
ATCT CAAAAGTGATTGTCATTGAAAT TGGTGATTCGC CAACAGTAAGGAGCACTGGAATGATTT C AT C C 
TTATCAAGTAACAAATTACAGAATTTGGCTCAT CGAGTCATCACTGCT CAACAGACTGGGGTACTAGAG 
AATGTTCTGAAT ATGACT AT CGGGGC CTTACTAGTTACTCAGTCAAAGGGAGTCATTGGCTATGGAAAT 
AC AAGC AGTTTTAAAACTGGGAACTTGATAT ATATT CGGCC CTATGCACTTT CCATCCTAGTCCAGCCT 
T (^GATGGAGAAGTGGGAAATGAGCTTCCAGTGCAGCCACIAATTGGTATT TTTGGATGAGCAGAAT CGA 
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AGAGTAGAGTCCCTGGGACCTCCTTCAGAGCCATGGACAATTTCAGCTTCCCTGGAAGGAGCATCAGAC 
T CAGTGCTAAAAGGGTGCACC CAGGCAGAAACTCAAGATGGTTATGTTAG CTTCTACAACTTGGCAGTC 
TTGATCT CTGGGTCAAACTGGCACTTTATTTTTACTGTCACTTCTCCTC CAGGAGT CAATTTTACAGCT 
CGATCCAAGCCATTTGCTGTCTTGCCTGTGACTAGGAAGGAGAAGTCGACCATCATCCTGGCTGCTTCC 
CTGTCCTCTGTGGCCTCATGGCTGGCTCT 

AGAAAAACAAAACCTGAAGAGATTCCTGAATC CCAGACT AAT^ CTCA 

TCCAAACGCCGAGAATCACAAGGGCCGAAAAAAGAAGACACTGTGGTGGGAGAAGA 

GTCATGCTGGGCAAGGTGAACCAGTGCCC C CACCAGTTGATGAATGGAGTGT CCAGAAGGAAAGTTAGC 

CGCCACATTGTCCGAGAGGAAGAGGCTGCTGTGCCTGCTCCTGGTACTACTGGCATCACATCCCATGGG 

CACATCTGTGCTCGAGGTGCTCCTGCTCA^ 

C^AGAGCAGTTGCTGAGATACCAGCTGGC^GG 

CAAGAGAGGCAGCAGTTGCCAGGGCAAAGTCGGCTGAGTAAGCAAAGTGGCAGCTTG 
GAGAAGAAAGCCTCCTGCGGGGCCACTGAGGCATTCTGCCTTCATTCAGTACACCCGGAAACTATTCAG 

GAGCAACTGTGA (SEQ ID NO : 1 ) 
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Human fibrocvstin sequence 



MTAWLISLMSIEVTjLLAVRHLSLHIEPEEGSLAGGTWITVIFDGLELGVLYP 

PALRSVPCDVFPVFLDLPVVTCRTRSVLSEAHEGLYFLELAYFGGQLVSSPNPGPRDSCTFKFSKAQTPI 
VHQVYPPSGVPGKLIHVYGWIITGRLETFDFDAEY 

HGLGTLQCHVEGDYIGSQISTVSFSVFNKGKSIWHKKAWLISAKQDLFLYQTHSEILSVFPET^ 

ITITGDFFDNSAQVTIAGIPCDIRHVSPRKIECTTRAPGKDVRLTTPQPGNRGLLFEVGDAVEGLELTE 

ATPGYRWQIVPNASSPFGFWSQEGQPFRARLSGFFVAPETS^ 

ASISVGTADWFDSWEQNRDEGTWQQKTPKLELLGGAMYYLEAEHHGIAPSRGMRIGVQIHNTW 

TT YLREKHQI RVRAQRLPE VQVLNVSGRGNFFLTWDNVS SQP I PANATAHL I QTT I EELLAVKCKLE PL 

WSNILLRLGFERGPEVSNSDGDLTSGTEPFCGRFSLRQPRHLVLTPPAAQKGYRLDQYTHLCLAYKGHM 

NKILKMIVSFTIGFQNWKNTTCDWSLTRTSPESWQFDCTDLWETC^CFGDLQPPPAN 

LPLAQETGLFYVDEI I IADTNVTVSQADSGTARPGGNLVESVSVVGSPPVYSVTSWLAGCGTELPLITA 

RSVPTEGTEEGSGLVLVTTQRRQRTSPPLGGHFRIQLPNTVI SDVPVQI SAHHLHQLLQNNADDFTSRY 

LNASDFTVKEDLYTCYEHWTLSWSTQI^ 

ATANQHTQWWVlSnDVPAHCP 

NKTSCKVIFSNQTNWCQTDLLPVGMHRILM^ 

WATIRGSSLEGVSLILFGSYSCAINVATS3STSSRIQCKVPPRGKDGRIVNVTVIRGDYSAVL 
SLNPVIVTLSRNISNIAGGETLiVIGVARLMNYTDLDVEVHVQDALAPVHTQSAWGLEVALPPLPAGLHR 
I SVS INGVS IHSQGVDLHIQYLTEVFS IEPCCGSLLGGTILSISGIGFSRDPALVWVLVGNRSCDIVNL 
TEAS IWCETLPAPQI PD AGAPT VPAAVE VWAGNRF FARGP S P S LVGKGFT FM YEAAAT P WTAMQGE I T 
NSSLSLHVGGSNLSNSVILLGNLNCDVET 

VLQQFAVMPRIMAIFPSQGSACGGTILTVRGLLLNSRRRSWVDLSGPFTCVILSLGDHTILCQVSLEG 
DPLPGASFSLNVTVLVNGLTSECQGNCTLFIREEASPVMDALSTNTSGSLTTVLIRGQRLATTADEPMV 
FVDDQLPCNVTFFNASHVVCQTRDLAPGPHYL^ 

GSLLTIEGTGLRGQNTTSWIDQQTCLTWIGAELIRCIVPTGNGSVALEIEVDGLWYHIGVIGYNKAF 
TPELISIS Q SDD I LTFAVAQ I S GAAN I D I F I GMS P CVGV S GNHTVLQC WP S L PAGE YHVRGYD C I RGW 
ASSALVFTSRVIITAVTENFGCLGGRLVHVFGAGFSPGWSAAVCGAPCRVLANATVSAFSCLVLPLDV 
SLiAFLCGLKREEDSCEAARHTYVQCDLTVAMATEQL^ 

LFISPKLERDEVLIYNSSCNITMETEAEMECETPNQPITVKITEIRKRWGQNTQGNFSLQFCRRWSRTH 
SWFPERLPQDGDNVTVENGQLLLLOT^ 

DKPFQGRAQITLYGSSYSTPFFPYGVKFIiAVRNGTLSLHGSLPEVIWCLRATAHALDTVLALEDAVDW 
NPGDEWI I SGTGVKGAKPMEE I VTVETVQDTDLYLKSPLRYSHNFTEJSTWVAGEHHI LKATVALLSRS I 
TIQGNLTNEREKLLVSCQEANAPEGNLQHCLYSMSEKMLGSRDMGARVIVQSFPEEPSQVQLKGVQFQV 
LGQAFHKHLSSLTLVGAMRESFIQGCTWNSFSRGLSMCGT^ 

I SWEAIHGRKDDWSGHGNI IRNNVI IQVSGAEGLSNPEMLTPSGI YI CS PTNVI EGMRVCGAGYGYFFH 

LMTNQTSQAPLLSFTQNIAHSCTRYGLFVYPKFQPPWDNVTGTTLFQSFTVWESAGGAQIFRSSNLRLK 

NFK^SCRDFGIDVLESDANTSVTDSLLLGHFAHKGSLCMSSGIKTPKRWELMVSOT 

IRTCSDCSQGQGGFTVKTSQLKFTNSSNLVAFPFPHAAILEDLDGSLSGKNRSHILASMETLSASCLVN 

S S FGRWHGS ACGGGVLFHRM S I GLANT PEVS YDLTMTDSRNKTTTVNYVRDTLSNPRGWMALLLDQET 

YSLQSENLWINRSLQYSATFDNFAPGNYLLLVHTDLPPYPDILLRCGSRVGLSFPFLPSPGQNQGCDWF 

FNSQLRQLTYLVSGEGQVQVILRVKEGMPPTISASTSAPESAL^ 

DDVLILPNRTVLVDTDLPFFKGLYVMGTLDFPVDRSNVLSVACMVIAGGELKVGTLENPLE 

LRAS EGVFCDRMNGI H I DPGT I GVYGKVHLYSAYPKNSWTHLGAD I ASGNERI I VEDAVDWRPHDKI VL 

S S S S YE PHEAEVLTVKEVKGHHVR I YERLKHRHI GS VHVTEDGRHI RXjAAEVGLLTRNI Q I QPDVS CRG 

RLFVGS FRKSSREEFSGVLQLLNVE I QNFGSPLYSSVEFSNVSAGSWI I S STLHQS CGGGIHAAASHGV 

LLNDNI VFGTAGHGI DLEGQAYTVTNNLVVLMTQPAWSTI WVAGI KVNQVKD INLHGNVV^ 

I RGHKCS S CELLWSDNVAHS S LHGLHL YKE SGLDNCTRI SGFLAFKNFD YGAMLHVENS VE I EN I TLVD 

NTIGL1^VVYVFSAJ>QJSFSVKKV^ 

LWPVFTSEPNQWPQEPiraKVRNDHSISGIMKLQDVTFSSFVXSCYSDDLDVCILPNAENSGIMH 
RTRMLKIKDKNKFYFPSLQPRKDLGKAATC 

FFNAGTFREEQKCTYQFLMQGFI CKQTDQVVLILDSADAIWAIQKLYPVVSVTSGFVDVFSSVNANI PC 

STSGSVSTFYSILPIRQITKVCFMDQTPQVLRFFLLGNKSTSKLLLAVFYHELQSPHVFLGESFIPPTL 

VQSASLLLNESIGAISTTFNIMDNLLYV^ 

QIGQNQIRFIHEMPGHEETLKAIADSRAKRKRNCPTVTCT 

ISKVIVIEIGDSPTWSTGMISSLSSNKIjQNLAHR^ 
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TS S FKTGNL I Y I RPYALS I L VQ P S DGE VGNE L P VQPQLVFLDE QNRRVE S LGP P S E PWT I S AS LEGASD 
SVLKGCTQAETQDGWSFYNLAVLISGSNWHFIFTVTSPPGVNFTARSKP^ 
LSSVASWLiALSCLVCCWLKRSKSRKTK^ 
VMLGKVNQCPHQLMNGVSRRKVSRHIVREEEAAVPAPGT^ 

QEQLLRYQLAGQNQLLLLCPDFRQERQQLPGQSRLSKQSGSLGLSQEKKASCGATEAFCLHSVHPETIQ 
EQL (SEQ ID NO: 2) 
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Rat Pkdhl transcript sequence 

Exons 1-67 

AGCGAGCTACCTGCATGGTAGCTAGCTAGCTGCAGGCTGGCCCATCACCAAATAACGCGGCGTCATTTT 
GAAGGGAC CGGTTT CT CTGATTTGAAGCAGAAAGCGGAGACAGGATCAGGCACAAAAGCT^ 
CAGTCGACC CT AAAAATGTGCTTCTAACATATGAGAGGT CTCAAGAGAGCTGAGCTACCCTGATGTGAT 
GCCTGCCTGGCGGATCTCTCTGTTGAGTGTGGAACTACTACTTTTAGCAAATGCTTACTCAAGTTTCCG 
GATTGAACCGAC^GAAGGTAGCCTTGC^GGGGGAACATGGATCACACTTGTTTTTGACGGTTTGGAAAC 
AAGTATTCTTTACCCCAACAATGGCTCTCAGCTGGCGATAGACCTGGTGAATGTGGGAACACCCGCCTT 
GAAGATCCCTTGTGACATCTCTCCCCTCTTCGTGGATTTGCCCGTGGTGACGTGCCAGACGAGGTCTCT 
T CCAT CAGAAGCACCTGAAGGTCTTTATTCTCTGGAGATACGCT CTGGGGAT CAACTGCTAGGCAGCCC 
GTGTGC CAGATTACTGGACAACTGTACTTTCAAGTTTTC CAAGGAGCAGACACCTGTTTTATAT CAAGT 
TAACCCATCAAGTGGAGTTCCAGGAGAAGTAGTGCATGTGTATGGCTGGGTCATTACTGATCGGATGGA 
AATTTTTGAT C CTGATGTGGACTACATGGAGAGC CCATTAATC CTGGAAGCTGGAGGAGACAAATGGCT 
TACT C CTTGTT CTCTTATAAACAGGAAGACAGGAAT CTGTTTTCCC ATC CAGGAGGAACATGGC CTTGG 
GACTGTGCAGTGTCGCGTGGAAGGCAGTT ATATTGGTTCC CAGAATGTTAGTTT CT CAGTATTTAACAA 
AGGAAGGTCGATGGTGCATAAGGAAGCCTGGCTGATCAGTGCTAAACAGGAACTGTTCCTGTACCAGAC 
ATACC C AGAAATCCACTCTGTGTTTC CAAAAGTTGGGAGC CTTGGGGGAAGAACAGACAT CACTATTAC 
TGGAGATTTCTTTGACCCTTCTGCCCGGGTTACCATTGCAGGCATTCCATGTGATATTAGACATGTGTC 
T C CCAAGAAGATTGAGTGCACCAC CAGGGCTCCAAGAAATGGAGCAAGGCTCACTGCTC CC CAGGCAAG 
TAAT CGAGGACT CCTTTTTGAAGTTGGAAATGCTGTTAAGGATGAGGAGCTGACTGAAGCCACC CCAGG 
GTACAGGTGGCAGATAGTTC CTAATGCTAGTT CTCCAT CTGGCT TTTGGTC C AAGGAAGGGAGAC CTTT 
CAGAGCACGGCTCAGCGGGTTCTTCGTGGCTCCAGAGACCAACAATTACACATTCTGGATCCAGGCAGA 
CAGCCAAGCTTTCTTGCGTTTCAGTT CTT CAGAGGAGC CAAGGATGAAGGTAGAAGTGGCTT CCATTGC 
AGTTGGCACTGCTGACTGGTTTGACTCTTGGGAGCAGAACGGGAATGAAGGGAGCTGGCAACAGAAGAC 
AAATAAGCTAGAACTGCAGGGCGGAGCC^AGTACTACTTGGAAGCAGAGCAGCATGGGATAGCTCCCAG 
CAGGGGGATGAGAATTGCTGTCCAGAT CCACAACAC CTGGCTGAATC CAGATGTGGTCAACACTTACCT 
T CTGGAGAAACAC CAGATC CGAGC CCAAGCCCAGAGAC TT C CAGAAATACAGGTGTTGAACATGTCAGG 
TAAAGGAAACTTTTTCCTTACTTGGGGCAATGTCTCCAGCCAACCAGTTCCTGCAAATG 
ACAGAT CCAAAC CAT CATCGAGGAGTTGCTGGTGGTGAAATGCAAT CTGGTACCCCTTT CAGCT CGTGT 
TCTCCTCTGGCTTGGATTTGAGCAAGGCTTAGATGGCTCCAGGTCTGATGGGGTCCTCACCAGTTCAAC 
CGAACCATTCTGTGGCAGATTCAGCCTTGGTCAACTTCGACATCTTATCCTAAGCCCTGGGGCTGTCAG 
TAAGGGCTAT CAGCTGGAT CGATACC CATATTTGTGCTTTGCAT ACAGAGGT CATATGAACAGGAC CCT 
GGACATGACTGTTTCTTTCCTATTTGGCTTCCAAAATGTCATGAAGAATATCACCTGTGACTGGAGTCT 
GATGGAACCCCACCCTGAGAGCTGGCACTTTACTTGCAATAACCTCTGGGACACATGTGTACGCCATTC 
TGAGGAGCTCCAGTCTTCTCTGGCAAACACCCCATTGCTGGTTCATCGGATCGACATCTTCCCTGTGGT 
TCCAGAGGCAGACTTGCTCTATGTGGATGAAATTATTCTTGCAGATACCAACGTAACAGTTTCTCAAGC 
CGATT GTGGAGTAGC CCGC C C AGGTGGGAATGTGGTGGAGT CAGTGTCTGTGGTGGGAGTCC CT C CAGT 
CTACAGCATAGCCTCTTGGATGGCAGGATGTGGCTCAGAACTTCCTCTCATCACTGCATGCTATGTGCC 
CACC CAGGGGACAGGCGAAGGATCGGAACTGATTGAGGTGACAGCGAAAAGACTCCAGAGGACAAGC C C 
ACCTTTGGGAGGACACTTCTCCCTCCACCTCTCTGATACAGTGATACCTGATGTTCCAGTGCATGTGTC 
. TGC GAGACAGCTTCATAAGCT ACTGCAGGACAATGCTGATGAGT C CACAT CTGGATAT CTCAATGC CGA , 
TGACTT CATTGTGACAAAGGAT CAAAATT C CTGCTATGAACATGTGTGGACT CTTTCCTGGACCACT CA 
GATTGGGGATTTGCCCAATTTCATCAGGGTCTCCGATCAAAATCTTACGGGGTTGAATCC 
TGCTCGTGTAGTATACGATGGCGGAGTTTTCCTTGGGCCCATTCTTGGAGACACACTGGCTACTGCCAA 
CCAGCAGACT CAGGTGACTGTAC AAGTGAATGACATACCAGC CCATTGTTCAGGCTCCTGCT CCTT C CA 
ATAG CAGCGAGCGT CAACTC C CAGCGTGGACTGTGTGTGGTATT C CCTTGGTAGTGATGTCAAC CTGC T 
GGTTCATTTTACTGGAAATGGTTT CC CTAGAGATGC CCAGTT CTT ACAGGTCACGGTGAT CAACACGAG 
TTGTGAAGTTATTTTCTCAAATGAAACCAACGTTGCC 
CCG'GGTTTTTA^^ 

TGTGK22y^CCCAGGCTGGATGCTGTGGAGCCT 

CCGAGGCTCTAGTCTAGAAGGCGTTAGCCTGGTGTTATTTGGAACTCGGTCGTGTGTCATTGATGTCAT 

TAGAAGCAATTCGCAACAGATTCAATGCAAAGTCCCACCTAGGGGGA^^ 

GACTGTGATGAATGGGGACCACTCCACAGTTCTTGCCA 

AOTGATTGTGTCTTTGAGC^GAAATAGAAGCAACATAGCAGGAGGTGAGATTCTGTTCCT 
ACTGATGGTGAACT ATACAGAT CTGAATGTGCAAATCTACATT C AGAACACTTCTGCTC AGGTC CTTGC 
AAAGACGGCATGGGGACTGGAGGTGCTGTTGCCTCCGTTGCTGCCTGGCATCTATGTGATTTCAGCATT 
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CATCAATGGAAT CAGC ATT CGTTCACAAGGGGTTGAT CTCCACATC CAGTACCT CACTGAAGTTTTCAG 

CATGGAACCTTGCTCCGGGTCTCTCTTGGGTGGAACTATCCTCAGACTCTCAGGAGCAGGACTGGGCAG 

AGACCCAGCT CTGATTCGGGTGCTTGTGGACAACCGT CCTTGTGATACTGTGAAGTTAACAGAAGTGAA 

CATTTGGTGTGAGACTCCCCGAGTCCTACTACCACCCAGAGCAGATGTTCTCACTGTCCCLAGCATCTGT 

GGAGATCTGGGCTGGCAACACTTCCTTCGTGGGGAAGGCCTTCATCTTCACATATGAAG^^ 

T C CAGTGGT CACTGCTATGTGGGGTGAACTCATGAACAACAGTGTAAGGTTT 

CCTCTCCGACTCAGTCATTCTTTTGGGATCCTTGAAATGTGACCTTCAAGTGCAATTGTTTGGTGATAA 
CATGAACCTGTCTGGGTGCTCCCTTCTTCTCCTICAGTTTGGAAGCTGGGGTCTATGCTCTCC^^ 
TCACAAGAGGATGGGGTTTGCCAATATGTCTGCGGTGC 
CGACATCTTCCCAACACATGGTTCTATATATGGTGGGAGAGTGCTTAC^^ 

GTCCAGAAGGAGGTCTGTTCATGTTGACCTTTCAGGTCCTTTTACTTGCGTGATTTTGAGTTTGGGAGA 
CCACACAGTCCTATGCGAGACCAAGTTTGTGGGTGATCAGTTTTCTGAAACAT 

CACAGTTCTGGTCAATGGGCTGACCAGCAAGTGTGAGGGGAACTGTACTCTCTTCCTGGAGGAAGCAGC 
AACTCCTATTGTGGATGCTTTGACTATAAGTATCAGTGGCTCTCTAACCACAGTGCTGATGAGAGGACA 
GAGGTTAGGCTCTGCTGGTGAGCCAAC^GCCTTTGTGGATGGTC^ 

TAATACCAGCTATGTGGCATGCCAGATGAGAGATTTGGCCCCGGGGTTCCACTATCTGTCAGCTGTTCG 
TACAAGTGCTGGATATGCTTGCCTCAATAGTGTTTCTAGAAACTTCTTCGTTGTGCCTCAGGTGTTCGA 
TTATTTTC CTAAGGATTTTAGCAT C GATGGTGGAAGT CTCTTGACTATAAAAGGCACAACC CTT CGAGG 
ATGGAAAACTACATTTGTCTATGTTGGCCAGCAGGCT TGT CTAACAGTGAACAT GAGTTCTGAGTTCAT 
CCAGTGCATTGTTCCCGCAGGAAATGGCTCTGCTGCTCTGGAAATAGATGTAGATGGAGTTTTATACCA 
C^TGGGATTTGTTGACTACAGC^GCATCTTTACCCCAGAATTGCTTTCTGTTTC^CGGAGT(^TGAC^T 
CTTGACCTTTACAGTGGCCCGGATCTCAGGGGCTGCAAATGTTGACATTCTTATTGGGACGTCACCGTG 
TCTAGATGTTGCTGGTAACCGTACGATTCTCCGGTGCATGGTCCCTCTGCTTCCTGCTGGGGAGTATGC 
TGTCACAGGTTATGACCACAGCAGAGGATGGGTCTCATCCACTCTCATTCTCGTGCTGAGAGCCACTGT 
GACCTCAGTGACTGAGAACTATGGCTGCCTGGGTGGAAGGCTTTTGCATGTGCTCGGAGCAGGATTTTC 
TCCAGGGAACATCTCAGCTGCTGTATGTGGTGCTCCGTGCCAAGTCTTGGCTAATGCGACAGTGTCTGC 
CTTCAGCTGCTTGGTTCTGCCCCTGGATGCGTCCTTGGCTTTCCTCTGTAACCTGAGGCATGCAGAAGA 
CAGCTGTGGAGTTAGCAGGCC CAC CTACTTGCAATGTGACTTGACTGTCTCCGTGGGGATGGAGAGACT 
GCCTGGATCCTGGCCTTACGTCTACCTTTGTGAAGAGAGTTCCCAGGGCCTCTTCGTACCAGATCACCA 
GATCTTCCTTTCCTTCTCAGGCCTCTTCCTCAGCCCTAAAGTGGAAAGAGATGAAGTTCTCATCTATAA 
TAGCTCCTGTAACATTACCATGGAAACTGAGGCAGAGATGGAGTGCGGGACACCTAATCAGCCAATTAC 
CGCCAAGATTACTGAAATACTVGAAAAGCCGGGGCCAGAACACTC^ 

C CGAAGGTGGT CCAGGC CTCAC AGTTGGTTT CCTCACAGAGTGCCACAAGATGGCGACAATGT CACAGT 

GGAGACCAGTCACCTGCTACTGCTAGATGCGAATACAAGTCTCCTGAACTCCCTGCACATTAAAGGTGG 

CAAGCTGATTTTCATGGAGCCCGGACCCATTGATCTCAGAGCCCATTCTATCCTAATTACAGACGGTGG 

AGAGCTCCATATTGGATCTGAGGAGAAGCCTTTCCAAGGCAAAGCTCGGATCAAACTCTATGGAAGTGT 

CCACTCCACTTCCTTCTTTCCCTATGGAGTCAAGTTCCTGGCTGTGAGGAATGGAACTCTTTCTCTGCA 

TGGTTCTGTTCCAGAAGTTACTTTTACCTATCTTCGAGCAGCTGCATGTGCAGGAGACACCGTGTTGGC 

TCTGGAAGAGGCCGTGGCTTGGCACCCTGGGGATGAGGCTGTCATTAGCAGTGGAGCGACTGTAGAAGG 

TGCTGAAGCAACAGAAGAGGTGGTTGTTGTAGAAACTGTCCACGATGCGGACCTCCATCTCAGGAACCC 

CCTGAGATACTCCTACAACTTCACAGAAAACTGGGTAACTGGAGTGAATCATATTTTGAAGGCTACAGT 

GGCTCTT CTCAGCAGGAACATTATTGT C CAAGGAAATCTCACT CT CGAGAGGGT AAAGCTTCTTGATTC 

ATGC CAGGAGGCCGGTGCTGCTGAAGGAAAC CTGAAGCATTGTTTATATTC TAAGAGTGAGAAGATGCT 

GGGAGCCAGGAATCTGGGGGCCAGAGTTATCATTGAGTCCTTCCCAGAGG^ 

GAAGGGAGTGC^GTTCCGAGACCTGGGACAAGCCTTCGATAAGGATCTAAGCTCACT^^ 

AGCTATGAGAGGT T CTTAT CTC CAGAGCTGTTCAATGTGGGGCT CCTTCAGCAGAGGC CTCAGCATACA 

CAGGACCTGGGGTCTGAAGGTGGAAAATAATATATTCTATAAGATTGTAGGTCATGCCCTACTGGTGGG 

GTCCTACTVTGGACAGAAGTTTTAGCACT^^ 

GGGAAGTATGATAAGAAACAATGTGATCATCAX^^ 

GT TGGCACCAGCAGGCAT CTACACTTTCAGT CC CACCAGTGCGATTGAGGGCAACAGAGTGTGTGCAGC 

TGGTTATGGCTATGTTCTCCACCTTGTGACCAGCC^AACAGTGCAAGCTCCACTACTCTCATTCAA 

GAATACTGCACATTCTTGTACAAGATATGGT CTC CTTGTATATCGTGAATTT CAACCGC CTTGGAATAA 

TGACACTGGCTT(^CTCTGTTTCAAAACTTC^TGGTTTGGGGAAGTGCTGGTGGTGCC<^GATTTTTAG 

AAGTAACAATCTGCACCTGAGAAACTTCCAAGTTTATGCATGCAGAGACTTTGGGATTGACATTTTGGA 

AAGTGACACGAACACTTTGGTTACTGAC^GCTTCTTACTAGGTC^CTTCACCCACGAGGGAAGTCTATG 
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TATGTCAGTTGGCATCAAAACTCCCAAAAGATGGGGACTGACGATTTCTAACACAACTTTCGTTAATTT 
TGATCTCAACTGTGTGGCCATCAGAACCTGTTCTGGCTGTTCCCAAGGACAGGGTGGATTTCCTGTCAA 
GACCAGGCAATTGAAGTTTGTCAACTCTTCAAATTTAGTAGCATTTCCTTTTCCTCATGCAGCAGTTTT 
GCAAGACTTAGATGGGTCCCTGTCTGGGAAAAATGGATCTCATGTTCTTGCTTCTATGGAAACCCTCTC 
AGACACATGTTTGACCAATGCAAGCTTCAGCCAGATTGTCTCTGGCAGCGTCTGTGGGGAAGCTGTTCT 
CTTCCATCGTATGTCTATTGGTTTAGCTAAGAGCCTCGACGTTCCTAAGAATTTAACCATGACTGACAT 
CAGAAATAGGACAATCACTAT CAATTATGTGGATGACACGTTGTCTAACTCT TATGGCTGGATGGCTCT 
ACTCTTGGACCAAGAGACCTACTTGCTGCAGTTTGAGGGTCCTTGGACGGACGGATCTTTGCAGTACTC 
AGCAACCTTTGACAACTTTGCCCCTGGAAATTACCTCCTGCTAATGCACAGGGACCTACTACCTTATCC 
CGACATTCTCCTCAGATGTGGGAGTCGGGTGGGCCAGTCACTTCCCTCTCATCCTTTGCCGAGTCGAGA 
CGGAGCCTGTGATTGGTTCTTCCACAGGCAGTTAAGGCAGCTCACCTACOT 

AGTTC^CGTATTCCTCCAGGTGAAGCATGGTGCACCTCGAACTGTTTCAGCTTCTACATCTGTATCTGA 
AT CAGCTTTAAAATGGT CC CTTC CTGAAAC ATGGCAAGATGTTGAAAAAGGCTGGGGAGGATAGAAC CA 
CAC CAT CC CAGGACCCGGTGATGACGTCTTGATTTTACC CAACAAGACGGTTCTTGTGGATACTGATCT 
CCCCGTGCTTAGATGCCTCTATGTGATGGGTACCTTAGAATTCCCTGTGGACAGAAGCAACGTTCTGAG 
TGTGGCGTGCTTACT CAT TGCAGGAGGGGAGCTGAAAGTAGGTACTTTGGAAAACC C CTTAGGAAAAGA 
CCAAAGACTTCTGATACTCCTCAGAGCCTCAGAAGAAATCTTCTGTGACCGTTTTGACGGAATACGTGT 
TGAC C CTGGAACAATTGGAGTTTATGGGAAACTTCGC CTTCACAGCGC ATAT CCTAAGAAATC CTGGGT 
ACACCTTGGAGCTGACATTGCCC CGGGAAATGAGAGGATTATAGTACATAATGCAGTGGATTGGCAGC C 
CCATGACAAAATCGT CCTCAGCTCTTCTTCTTATGAGC CT CATGAGGCAGAGGT C CT CACTGTGAAGGA 
AGTCAAGGACCATGACATCAGGATCTATGAACGTCTAAAACACAGGCACATTG 

GGAGGATAGTCGACAGATTTGTTTGGCTGCTGAGGTTGGATTGTTGAC CAGAAACATTAGAATTCAGT C 
TGACT CAT CCTGTAGAGGGAGACTCCTTGTGGGGTC CTTCAGGAAATCTAGCGGAGAAGAGTTTT CTGG 
CATTCTTCAACTTCTAAATGTAGAAATTCAAAACATGGGGTCACCACTGTATGCATCTATTGAATTCCC 
CGGTGTGTCAGCTGGATCCTGGGTTATATCTTCTACTGTACATCAAAGCTGC^ 

ATCTTCTAGTCGTGGGATGGTCTTAAATGACAACATAGTGTTTGGCACAAAAGGCCATGGAATCGATGT 
GGAGGGTCAGAACTATTCTCTCACCAATAACCTTGTCATTC^ 

TTGGGTGGCAGGAATCAAAGTGAACTATGCCGAAGATATCATTCTCCACGGCAATGT 

TGAGAGACTTGGCTTTCATGTCCGTGGCCATGGGTGCTCCTCTGAAGTGCTTTGGTCTGACAATGTGGT 

CCACTCAAGCCTCCA.TGGCATTC^CCTCTAC^AGAAACGTGAACCTAATAACTGTACTGGTGTCTCTGG 

ATTTCTGGCTTTTAAGAACTTTGACTATGGTGCCATGGTTCAGACAGAGAATAGTGTGGACATACAGAA 

TATCACTCTGGTGGATAATACTGTTGGTCTTTTGGCCATCTCGTATGTATCTTCGGCTCCACTGAGATC 

TGGCAGCA£!TCTAGAGATTACTCTTAGGAATTCAGTG^^ 

CC AAGACAGAAAGGCT CCTCAGTCGGC CAACTGGACCTCCACAGATAGAGCGC CTTCCAATCC CAGAGG 
AGGC CGGATCGGTATTCTGTGGCCTGTAT CTGCCTCAGAACCAAATGGATGGC C CCAGGAGC CATGGCA 
CAAAGTAAGGGGCGGTCATTCAGTTCCAGGAATTATGAAGCTTCAAGATGTCACCTTTTCTAGTTTCGT 
GAAGAGTTGCTATAGCGACGATCTGGATGTCTGCATCCTGACTAATGAGCACAGCACTGGAATCATGTA 
CCCAATAACAGCAGAGAGGAC CAGAATGCTGAAGATAAAGGACAAAAACAAGTT CTACTTT CTTCCATT 
ACAGT CTGGGAAAGACTTAGTGGGAAC CATCTGC CCTGCATCATCGGACTGTGAAATT CCAAGAAAATA 
CCTCTT CACAGATCTGGATGGGAGAAC C CTGGGTCTGTCCC CACCAGTTTCTGTGTTTC CAAGGATAGA 
GGAAGGATGGACTGGATC CTT CTT CAACACAGGTATATT CAGAGAAGAACAGAAATGCACATTTCGAGC 
CATGATC CAGGGCTT CTT CTGTAAGCAGACTGAGCATGCAGTC CTAATTCTTGATAATGTTGATGTAAC 
TTGGACAATCCCCAAATTCTACCCACTCGTATCCATTACTAATGGTTTTGTGGACACGTTCAGTATCGT 
GAAGGACAGTGGTCTATGCTTCCCCAC^GCTCCCCGTCTACTTTTTATTCCATCTTACCCA.CCAGCC^ 
AATGACCAAAGTATGCTTTCCAGAGCGAACTCCCCCATTCCTGCACTTTTTTCTACTGGCAAACAGAAG 
AGCGT C CAAGCTC ATCTTGGC TGTGTTCTACAATGAGAT T CAGAGC C CCTACGTTTTCTTAGACAAGAG 
CTTTATTCCACCTACACCAGTAGAGTCAGCATTTTCACTGTTGGATGAGCCTGTTGGTGCCAACTATTT 
CGACAT CATGAATAACCT CTTGTATGTTGTC CTGCAA.GGAGAGGAGGCTGTTGAAATACGTTCAAGTGT 
TT C CATTCATTTGGCTTTGACAGTGACATTTTCAGT C CTAGAAAAGGGCTGGGAGAAAGCAGTGCTTGA 
AAGTCTAAGAGGCTTCTTC<^GATTGACCAAAACCAAATCAGACT(^CTCTTGAGATGCCTGGCAAC^ 
AGAGACCTTAAAGGC CATTGCAAA.CAGTGAAGGAAAACGAAAGCGCAGTTGCCCAACTGTGACT TGTGC 
TGTCCCTTCTAGCAGATATGTTCAACGCAGACCTCTCATGGC^ 

AGCAACCACTCTGGAAACTTTCTCAAAGGTGATTGTCTTTGAAATCGGTGATCTGCCAAATGCAAGGGA 
CAGTGAATTCATTCAGTC CTTACCAAGTAACAGATTACAGAAATTGGCTCACG^ 

ACAGACTGGAGTTCTGGAAAATGT C CTTGGTATGACTGTTGGGGCC CTACTAGTGGCT CAGTCAGAGGG 



10/501834 



WO 03/062453 ' PCT7US03/02038 



13/47 
Figure 6 - page 4 

AGTCACAGGATATAGAAATGCAAGTAGTTTAATAACTGGAAACCAGATATATACCCGGCCCTCTGTGGT 
TTCCATCCTGGTGCAGCCTTCAGATGGGGAAGTGGGAATAGAATTACCGATTC^GCCACGGCTCATCTT 
CCTGGATGAGAAGAATGAGAGAGTGGAAGCTTTGGGT CTCC C CTCAGAAC CTTGGATTATTT CAGTTTC 
CCTGGAAGGGACATCTGAATCAATGCTAAAAGGGTGTACCCAGGCAGAAACAC^ 

CTTCTCCAGATTGGCTGTCTTGACCTCTGGGTCAAACTGGCACTTAGTTTTTACTGTCACTTTCCCTCC 

AGGTACTAATTTAACAGCTCGATCCAAGACCTTTGCTGTCCTGCCTGTGGCCGGCAAGGAGAGGTCAAC 

TATCATCCTGGCCTTGTCCCTGTGCTCAGTGGCGTCTTGGGTGGCTCTAAGTTGTCTCATTTGCTGCTG 

GTTT AAGAAAAGCAAAAC CAGAAAAAT AAAAC CAGAAGACAT AT CTGAAT C CCAGGCT AAGGAACAAAA 

GAAGAATACCCATATCTCTTCCAAACCCAGAGAACTACAAGTAAAGACCGCAAAAGAAGACGCTATGAT 

GGGAGAAGACATGAGAATGAAGGTCATGGAGGGAAGGCAGAAC CAGTTTT C C CAACAC T CAATGGATGG 

AGTGT CAAAAAGAAAAGTTAGC CGC CGTGCTGTCCCAGAGGAAAGAACAGCTACACCTGCC CTGAAGAT 

TCCCAGAACGACCTGTGTCCCAGGAGCTCTTCCTCAGCAGTTGACTCTGCCGGAGCCTGGGAACTGGCA 

GGAGGCCCTU^CAGCAGCTGCTTAGATACCAGCTGGCAGGCCGCGATCAGCTGCTTCTGTTATGCCCAGA 

CCTCAGGCAAGAGAGGCAGCAGGGTCAGGAGCCTAGCGAGCTGA^^ 

GCTGTCTCAAGAGAAGGCCACTTGCGTTCCGACTGAGACCTTCTGCCTTG^^ 

TATC(^GTAACAGCTGTGGGCGCGGAGCACTGTGGGCGTTTGTATGAAAAGGAGAAACTGTTCAAAATT 
ATTTCTACATGGTGAACGGGGGAGGAGAGGTCTGATCTGTTTGGACAACTAAGGGAGAATGGGGACGAC 
TGTAATTAAGCTTCTCTTAGAGCCAACACTCAGGATGCTTCAGGCTTGTCTTATGGAAGACCTGTGATA 
GATTTAGTTAGCTGATGTTGTATCTGCAGGACTAGAGAAATACTCAGGAGATATCTTACACCAAAGCTT 
ATC CC C CAAACAGAGGTAACRTAATAAGAGTTACTTGTAGATTTTATTT CGTGGTTTAAATTTAGTAAT 
TATTGGGAGCTTTCTGCATTGCAAGCATTATTATTTGCACCTCATGAGTATTTGTACATGAAAGATGAT 
GGTYACATAGGCTTTGTTGGGATTTCAGTTAAGAAAAAGATATGAAAAGACTAAATTTAGGCAATTTTT 
ATGTACTATAGGTACATTTCACACCAGGTATTTATATGAAAAGGGGAAATATTCAAAGCTACTTCTCTG 
TGGTAAGTGGGAAAAGAGAGGTCTGATCTGTTTGGACAACTAAGGGAAAAATGTGGACTCTCAATATTT 
TGACTTAATAGTTCTAATAATTTCTTCTAGTTGGGTAAAATTTACAACTACCAGGGAATTTTTCTAGAA 
GACTAAACATAATCTAATGGTAAAGTGGACTAATGGCTCTCTTATTTATCAGAGAACTGATTTTTGTTT 
CCCACAAAAAGCAAGTATAAGGAGTGCCCT^GAGACTAGAAAAGAAATCTTAGGTATGGTCTTTTGAAG 
CTGTGTTTAGGGAGATGAAGCAAAGAGGTAGCTGATGCTTTAAGAAAGAAAGTGCATCAAT CAC CCTCT 
CTAAACTGCTGAAAATTTTATAAGGAATAGATAGATGCCAAAGGATTTTCCTGAACTGATTGATATATT 
TATGTGACCTTTTATCTTCTTTAGTTTACTGATACAGTAATGCATTCCGTGACTTGGATTCAAACGCTG 
AAC CAAATTTACATACCTTAAATAAATC CTGCTGGCATATTTTTTGATATACTAACAGGTTTAGTTTGC 
TGATATTTTATTGTATTTTATATCTAAATGATATAAAATATTATAAAATAATATAAAATGATATGAGAT 
ATT CGAT CATAATTT CAGTTTATTTTTT CAATTAACTTTAGCCATGCATAGT TTGAATGC CTGTAGCCT 
AAGCTTT CC CAAAAGAGACGGC CGGAAAATGCTTTAGCACGGGAATT CAAGGCCAGT CTGAAC C CCATA 
GCAAGAC AAAATAATTT CTTTAAAACGTGAATTAGGTGTAGGGCAT CTGGTGACACATGC CT CTGGC CC 
CAGT AC T CAAGAGAT AGAAT AG CAGG CATCACAAAT TTAAAGGTAGC CTGGGAT C CAC AAT ATGCTGCA 
AGCCAAC ATGACTTATC CACAAAGAACTTGT CTCAATAGAGAAAAAAGAATTAGGAATGCTCTGTATTT 
TCTGGAAGAAATTCTGTGAAGTTGGAGGGGGGAAATGGAACTTTTGTTGTTGTTTTCTGTAGTCTGTAA 
AAACATTGTATGGAATAAAAAAAAAAAAAAAAA (SEQ ID NO : 3 ) 
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Mouse Pkdhl transcript sequence 

Bxons 1-67 

CACTGTTGGCCTACTGGTAGCTAGCTAGCTGCAGGCTGGCCTGTCACCGAATAGCGCGGCTTCGTTTAG 
AAGGGGACGGTTTCTCTCATTTGAGGCACAAGGCTG^ 

AAT CAACCCTAAAAATGCTT CTAATATCTGAGGAAT CTCAAGAGAGCTGAGCTAAC TGGACATGATGCT 
TGCCTGGCTGGTCTCTCTGCTGAGTATGGAAGTACTACTGTTAGCAAAGCCTTACTCGAGTTTCCAGTT 
TGAAC C CGCAGAAGGTAGCCTTGCAGGAGGAACATGGAT CACAGTTGTATTTGACGGTTTGGATAGAAG 
TATT CTTTACCCCAACAATGGCT CT CAGCTGCAGATAGACCTGGTGAGTGTGGCAATAC CTAC CTTGAG 
GATCCCCTGTGACGTCTCTCCGGCCTTCGTGGATTTGCCTGTGGTGACATGCCAGACGAGGTCTCTTCC 
ATCAGAAGCAGATGCAGGGC CATACT CC CTGGAAATGCGCTCTGGGGAGCAAGTGCTAGGCACT CCATG 
TCCTGGATCACTAGATAGCTGTACTT TCAAGTTTT CCAGGGATCAGACAC CTGTTTTATATCAAGTTTA 
CCCAGCAAGTGGAGTTCCAGGAGAAGTAGTGTC CGTGTACGGC CGGGT CATCACTACCTGGCTGGAGAC 
CTT CGATCCTGATGTGGACTACATAGAGAGC CCATTGAT CCTAGAAGCTAGAGAAGACAAATGGCTTAC 
T C C CTGTTC CCT TAT AAACAGGC AGACAGGAAGCTGTTTTCCCATC CAGGAGGAGCATGGCCTTGGGAA 
TGTGCAGTGTCGTGTGGAAGGCGATTATATTGGTTCTCAGAATGTTAGTTTTTCAGTATTTAACAAGGG 
GAGGT CGATGGTGCATAAGGAAGCCTGGCTCATCAGTGCTAAACAGGAACTGTTCCTGT AC CAGACATA 
CCCAGAAATCTTAT CCGTGTTT C CAAAAGTTGGGAGCCTTGGGGGAAGAACGGACAT CATCATTACGGG 
AGATTTCTTTGACCCTTCTGCCCGGGTTACCATTGCAGGCATCCCATGTGATATTAGATATGTGTCTCC 
CAGGAAGATTGAGTGCACTACCAGGGCTCCAGGAAATGAAGCAAGGCTCACTGCTCCTCAGGCAGGCAA 
TCGAGGACTCCGTTTTGAAGTTGGAGATGCTACTAAGGATGTGGAGCTGACTGAAGCCACCCCAGGGTA 
CAGGTGGCAGATAGTTCCTAATGCCAGTTCTCCATCTGGCTTTTGGTCAAAGGAAGGGAGACCTTTCA^ 
AGCACGGCT CAGTGGGTT CTTCGTGGCGC CACAGACAAACAATTACACATTCTGGATC CAGGCAGACAG 
CCAAGCTTC CTTGTGTTTCAGTTCTT CAGAGGAGCCAAGGACCAAGGTAGAAGTGGCCT CTGT TGGGGT 
TGGCACTGCTGACTGGTTTGACTCTTGGGAGGAGATCGGGAATGAAGGGAGCTGGCACCAGAAGACAAC 
CAAGCTAGAACTGCAGGGCGGAGCCAAGTACTACTTGGAAGCAGAGCAACATGGGATAGCT CC CAGCAG 
AGGGATGAGAATTGGTGTC CAGATC C^CAACACCTGGTTGAATCCAGATGTGGTCAACACTTACCTTCT 
GGAGAAACACCAGATCCGAGCT CGAGC CCAGAGACTTCCAGAAATACAGGTGTTGCATGTGT CAGGT AA 
AGGAAACTTTTTCCTTACTTGGGGCAATGTCTCGAGCCAACCAGTTC^ 
GATCCAAACCACCATTGAAGAGTTGCTTGTGGTGAAATGCAATC^ 

TCT C CGGCTTGGATTTGAGCAAGGTTTAGAAGGCTC CAGGTCTGATGGGGTCCGCAC CAGTT CAACTGA 

ACCCTTCTGTGGCAGATTCAGCCTTGGTCAACTTGGACATCTTATCCTAATTCCAGAGGCTGCCGACAA 

GGGCTAT CAGCTGGAT CGATAC C CGTATCTGTGCCTTGCGTACAGAGGC CATATGAAC AAGACCCTGGA 

CATGACTGTTTCTTTCCTCTTTGGCTTCCAAACTATCATGAAGAATATCACCTGTGATTGGAGTCTTAC 

CGATCCCCACCCTGAGAGCTGGCAGTTCACTTGCATTAACCTCTGGGACACATGTCTATGT 

GGATATCCAGTCTTCTCTGGCAAACACCCCATTGCTGGCTCATCGGATTGACATCCGCCCCGTGGTTCC 

GGAGGCAGGCCTGCTCTATGTGGATGAAATTATTCTTGCAGATACCAACGTAACAGTTTCTCAAGCTGA 

TTCTGGAAGAGCCTGCCCAGGTGGGAATGTGGTGGAGTCAGTATCGGTGGTGGGAGTCCCTCCGGTCTA 

CAGC ATAAGCT CCTGGTTGGCAGGATGTGGCTCAGAGCT C CCT CT CATCACTGCATGCT CTGTGTC CAC 

GGAGGGAACAGGAGATGGATCTGAATTGATTGAGGTGACAGCT CAAAGACTC CAGAGGAC AAGC C CAC C 

TTTGGGAGGACACTTCTTCCTTTACCTCTCTGACACAGTGATACCTGATGTTCCGGTGCGCATGTCTGC 

CCGACAGCTGCATAAGCTACTGCAGGACAGTGCTGATGAGTCCACATCTGGATATCTCAATGCCGGTGA 

CTTCACTGTGACAGAGGATCTGAATTCCTGCTATGAACATGTGTGGACTCTTTCTTGGACCACTCAGAC 

TGGGGATTTGC CCAATTTTATCAGGGTCT CTGAT CAAAAT CTTACTGGGGTGAATC C CACTGTAACTGC 

TCGCGTGGTATATGATGGTGGAGTTTTCCTTGGACCCATCTTTGGAGACATGTTGGCTACTGCCAACCA 

GCAAACT CAGGTGGCTGTACAGGTGAATGACATAC CAGC CTATTGTTCAGGCTCCTGT T CTTT C CAATA 

CCAGCAAGAGTCAACTCCCAGTGTGGATCATGTGTGGTACT 

TCATTTTACTGGAACTGGTTTC C CTAGAGACACC CAGTTCTTACAGGT CACGGTGAACAAAACTAGCTG 
TGAAGTTCTTTTCTCAAATGAAACCi^TGTGGCCTGTGAGCTGGCTCTGCTACCAGTTGGAGTGCACCA 
GATTTTTATGCTGGTGATACCGTCAGGCCTTGCTGTTCATGCCAGTGGAGAAGACCTCCTCCTGCATGT 
GGAAC CCAGGCTGGATGCTGTGGAGC CTTCTACAGCTGCAGAGATTGGAGGACGGTGGGTTACT CTCCG 
AGGCTCTAGTTTGGAAGGTGTTAGCCTGGTGTTATTTGGAACTCAGTCATGTGTCATTGATGCCATTAG 
AAGCAATT CACAACAAATT CAATGCAAAGTC CCAC CTAGGGGGAAAGATGGATACACTGTGAATGTGAC 
TGTGAT CAGTGGCGAC C ACTCTACAGTT CTTGCCAGAGCATTTACATATGTCTCCTCTTTAAAT C CAGT 
GATTGTGT CATTGAGCAGAAACAGAAGCAGCATAGC AGGAGGTGAGATT CTGTT C CTTGGGATGT CACT 
GCTGGTGAACTAC^CAGATCTGGATGTGCAAAT CCATGTGCAGGATACTTCTGCTCAGGTC CTTT CACA 
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GACAGCGTGGGGACTGGAGGTAGTGTTGCCTCCACTAGTACCTGGCATCCATGTGATTTCAGCATTCAT 

CAATGGAGT CAGTATTCGTTCACAAGGGGTTGATCT CTATATCCAGTACCTCACTGAAGTTTT CAGCGT 

GGAACCTTGCTCTGGGTCTCTCTTGGGTGTTTTTCTCCTCAGTCTCTTAAGAACAGGACTGGGCAGAGA 

C C CAG CTCTGATTCGGGTGCTTGTGGACAATCAT CCTTGTGATATTGTGAACTTAACGGAAGTGAACAT 

TTGGTGTGAGACT C CTCCAGCTGTACTACCACC CAGGGCAGATGTT CTCACTGT CCTAGCCTCTGTGGA 

GATCTGGGCTGGCAACACTTACTTCTTCCATGGACGAAGCTTGGTGGGGAAGGGCTTTACCTTCACATA 

TGAAGCAGCAGCGAC AC CAGTGGT CACTGCTATGTGGGGAGAATT CAAGAACAACAGTGTGAGGTTTTA 

TGTGGAAGGAAGTAACATCTCTGACTCAGTCATTCTTTTGGGGTCCTTGAAATGTGAACTTGAAGTACA 

ATTTTTTGGTGATAGCATGAACTTGTCTGGGTGCTTTTTTCCTCTCCATAGTTTGGAAGCCGGGGTCTA 

TACTCTCCAAGTTCGTGACAAGAGGATGGGGTTTGCCAATATGTCTGTGGTGCCTCARA 

GTCAC CTCAGATTATTGCCATCTT CCCAACACATGGGTCTAAATGTGGTGGGACAGTACTTACTGTGAA 

GGGCATGGCCTTGAGTTCCAGAAAGAGGTCAGTTGATGTTGAGATTTGAGGCCCTTTTGCTTGCA 

TTTGAGTTTGGAAGACCACACAGTCCTATGCCAGACCAGATTTGTGGGTGACCAATTTTCTGAAGCATC 

ACTGGCTCTAAACATCACAGTTCTGGTCAATGGGCTGACCAGCAAGTGTAAGGGGAACTGTACACTC 

CAT AGAGGAAGCAGCAACTCCTATTGTGGATGCTTTGACTATAAGCAT CAGTGGGTCTCTAAC CATGGT 

GCTGATGAGAGGC CGGAGGTTAGCTACCACTGCTGATGAGCCAATAGCATTTGTGGATGAT CAACTTCC 

CTGC CACACAACAT TCTTCAATAC CAGCCATGTGGCATGCCAGATAAGAGATT TGGCCCCAGGCTT CCA 

CTATCTGTCAGCTGTT C ATACAAGTGCTGGATATGCTTGC CT CAATAGTGTTT CTAGAAACTTCTT CAT 

CGTGCCTCAGGTGCTTGATTATTTTCCTAAGGACTTTAGCATCCATGGTGGAAGTCTCTTGACGATAAA 

AGGCACAGCCCTGCGAGGATGGAAAGCTACAGTTGTCTATGTTGGCCGGCAGGCTTGTCTAACAGTGAA 

CTTCAGCTCTGACTTCATCCAGTGCATTGTTCCTGCAGGAAATGGCTCTGCTGCTCTGGAAATTGATGT 

GAATGGAGTTTTATACCACATAGGACTTGTTGATTACAGCAGTAT CTT CAC C CCAGAATTGCTTTCTGT 

TTCACGGAGCCAAGACAT CTTAAC CTTTACAGTGGCCCGGATCTCAGGGGCTGCAAATGTTGACAT TTT 

TATTGGGACAT CACCGTGT CTAGGTGTTGCTGGCAAC CGTACAGTT CTCCAGTGCATGGT CCCTCTGCT 

TCCTGCTGGGGAGTATCTTGTCAOVGGTTATGATCACAGCCGAGGGTGGGCCTCATCCACTCTCATTCT 

TGTGCTGAGAGCCACTGTGACCTCAGTGACCAAGAACTATGGTTGCCTGGGTGGAAGGCTTTTGCATGT 

GCTCGGAGCAGGATTTTCTCCAGGGAACATCTCAGCTGCCGTATGTGGTGCTCCATGCCAAGTCTTGGC 

TAATGCGACAGTGTCTGCCTTCAGCTGCTTGGTTCTGCCCCTGCATGTGTCCTTGGCTTTCCTATGTGA 

CC TGAGGCATGCAGAAGACAGCTGTAAAGT CAGGAGCTCCACCTACTTGCGATGTGATTTGACTGT CTC 

CATGGGGACAGAGAGACTGCCTGGATCCTGGCCTTATGT CT AC CTTTGTGAAGAGAGTT CCCTGTGC CT 

CTTCGAACCAGATC^CTGGACAGAGTCAGTCTTTCCATCGTTCTCAGGCCTCTTCCTCAGCCCTAAAGT 

GGAAAGAGATGAAGTTCTCAT CTATAATAGCTC CTGT AACATTACCATGGAAACTGAGGCAGAGATGGA 

GTGTGAGATGC CTAATCAGCCAATTAC CGC CAAGATTACTGAAATACAGAAAAGCTGGGGC CAGAACAC 

TCAGGGCAACTTTTCCTTCCAATTCTGCCGAAGGTGGTCCAGGCCTCACAGTTGGTTTCCTCAAAGAGT 

GCCACACGATGGCGACAGTGTCACAGTGGAGACCGGTCACCTGCTACTGCTTGATGCGAACACTAGCTT 

CCTGAACTCCCTGCACATTAAAGGTGGCAAGCTGA^ 

C CACT C CAT C CTTATTACAGATGGTGGAGAGCT CCATATTGGATCTGAGGAAAAGCCTTTC CAAGGCAA 
AGCTCGGATCAAAATCTATGGAAGTGTCCATTCCACTCCCTTCTTTCCCTATGGAGTCAAGTTCCTAGC 
TGTGAGGAATGGAACTCTTT CCCTGC ATGGTT CAGTT CCAGAGGTTACTGT CAC CTAT CTTCAAGCAGC 
TGCACATGCAGGAGACAAAGTGTTGACTCTGGGGGAAGCTGTGGACTGGAAGCCTGGGGATGAGGCTGT 
CATTAC C AGTGGGATGACTGTAGCAGGAGCTGAAGCAACAGAAGTTGTTGTTGTAGAAACTGTC CACAA 
TGCAGACCT CCAT CTCAGGAAC C C CCTGAGATATT C CTATGATTTCAGAGAGAACTGGGTAGCTGGAGA 
GAATCCTATTTTGAAGCCAAGAGTTGCTCTCCTCAGCAGGAACATTATCATCC^ 

TGAGAGGGTAAAGCTT C TCAATT CATGCCAGGAGGCC AACACTGCTAAAGGAAACCTGAAGCATTGTTT 
ATATT CTAAGAGTGAGAAGATGCTGGGAGCCAGGAATCTGGGGGC CAGAGTTATC ATT CAGTCC TTCCC 
AGAGGAAC C CAGCTTGGT CAAGCTGAAGGGAGTGCAGTT C CGAGAC CTGGGACAAGC CTTC CATAAGCA 
TCTAAGCTCACTCACCCTGGTGGGAGCTATGAGAGGCTCTTATATCCAAAGCTGTTCAGTGTGGAACTC 
CTT CAGCAGAGGCCTTAGCATGCACAGGAC CTGGGGT CTGAAGGTGGACAGCAATGTATTCTATAAGAT 
TGTAGGGCATGC C CTGCTGCTGGGGT CCTAC CTGGACGGAAGGTTTAGCACTAGTGAGACTGTTACTGG 
AAGAAAAAATGGTTGGTGGGAACAGGGAAGTACAATAAGAAAG^ 

TGAGGGACTGTCCGGTTCTGAAATGTTGGCACCAGCTGGCATCTACACTTTCAGTCCC^CC^TGTGA^ 
GGAGGGCAACAGAGTGTGTGCAGCTGGCTATGGATATGTCTT CCAC CTTGTGACCAGCCAAACATTACA 
AGCTCCACTCCTCTCATTCAATTGGAATACTGCTCATTCTTGTACAAGATATGGTCTCCTTGTATATCC 
T AAATTT CAAC CAC CTTGGAATAATGACACTGGCTTCACTCTGTT CCAAAACTT CATGGTTTGGGGAAG 
TGCTGGTGGTGCCCAGATTTTTAGAAGTAACAAT CTACAC CTGAAAAACTTC CAAGTTTATGCATGCAG 
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AGATTTTGGAATTGACATTTTGGAAAGTGATGCGAACACTTTGATTACCGACAGCTTTTTACTTGGTCA 
TTTC AC C CACAAGGGAAGTCT ATGTATGT CAGCTGGGATCAAAACTC C CCAAAGATGGGAACTGAC CAT 
TTCGAAGAC^CTTTTGTTAATTTTGATGGCAACTGTGTGGC(^TC^GAACCTGTTCTGGCTGTTTCCA 
AGGACAGGGTGGCTATACTGTGAAGAC C AGGCAATTGAAGTTTGTAAACT CTT CAAATTT AGTWGCATT 
YYCATTTCCTCATGCAGCAGTTCTGGAAGACTTAGACGGGTCCCTGTCTGGGAAAAATGGGTCTCATGT 
TCTTGCATCTATGGAAACCCTCT(^GA(^CATGCTTGACCAATGC^GCTTC^GTC^GATTGTCCCTGG 
CAGCGTCTGTGGCGAAGCTGTTCTCTTCCATCGTATGTCTATTGCTCTAGCCAATAGCCTTGATGTTCC 
TAAGAATTT AACCATTACTGACATCAGTAAT AAGAGAATCACTGTCAATTATGTGGAAGACA C 
TAACTACTACGGCTGGATGGCTCTGCTCTTGGATCAAGAGACCTACTCGCTGCAGTTTGAGAGCCCTTG 
GATGAACAGATCT CTGCAGTACT CAGCAACGTTTGACAGCTTTGCT CCTGGAAATTACCT C CTGATAAT 
GCACAGGGAC CTAC CAC CTTAT C CTGACATCCT CCTCAGATGTGGGAGTCAGGTGGGCCATT CACTTCC 
ATTT CATCCTTTGC CTAGT CAAGACAGAGC CTGTGATTGGTT CTT CAAT AGGCAATTGAGGCAGCT CAC 
CT ACCTGGTTT CAGGTGAAGGTCAAGTT AAGGTATTT CT CCAACTGAAGC CTGGTGT ACCT CCAAGTGT 
TT CAGCTT CTACATCAGTAC CTGAAT CAGCTTCAAGATGGT CT CTT CCTGAAACATGGCAAGATGTTGA 
AAAAGGCTGGGGAGGATACAAC CACAC CATCC CAGGACCCGGTGATGATGTCTTGATTTT ACCCAACAA 
GACTGTTCTTGTGGATACTGATCTCCCAGTGCTTCGATGCCTCTATGTGATGGGTACCTTAGAATTCCC 
TGTGGACAGAAGCAACGTTCTGAGTGTGGCATGCTTACTCATTGCAGGAGGGGAGCTGAAAGTAGGCAC 
TTTGGAAAACCCCTTAGAAAAGGAC CAAAGACTTCTGAT ATTC CTTAGAGC CTCAGAAGAAGT CGT CTG 
TGACTATTTTGAAGGAATTCATGTTGACCCAGGAACAATTGGAGTTTATGGGAAACTTCGCCTTCACAG 
TGCTTATCCTAAGAAATCCTGGGTACACCTTGGAGCTGACATTGCACCGGGAAATGAGAGGATTATTGT 
ACACAATGCAGTGGATTGGCAGC CT CATGACACAATTGT CCTCAGCTCTT CTTCTTATGAGGCTCATGA 
GGCAGAGGT CCTCACTGTGAAGGAAGT CAAGGGCC AT CAC AT CAGGAT CT ATGAACGTCTAAAGCACAG 
GCACATTGGAAGTAC C CACAC CATGGAGGATGGT CAAC AGGTTCATTTGGCTGCTGAGGTTGGGCTGTT 
GACCAGAAACATTAGAATTCAGC CTGACT CATCCTGTAGAGGGAGACTC CTTGTGGGGT CCTT CAGGAA 
GTCTAGCGGAGAAGACTTTTCTGGTGTTCTTCRACTTCTCAATGTAGAAATTCAGAACATGGGGTTGCC 
ATTGTATTCATC TATTGAATTCACTGGTGTATCAGCTGGAT C CTGGGTAATATCTT CTACTGTGCAT CA 
AAGTTG CAGTGTGGGCATC CATGCAT CTT CCAGC CATGGCGTGATTTTAACTGATAATGTAGTGTTTGG 
CACAAATGGC CATGGCATCGATGTGGAGGGTCAGAACTATT CTCT CAC CAATAACCTTGT CATTCTGAC 
AATGCAGTCAGCAAACT CAT CTCCTTGGGTGGCAGGAAT CAAAGTGAACTATGC AGAGGACATCAT TCT 
. CCATGGCAATGTGGTGGCAGGATCTGAGAGACTTGGCTTTCATGTCGGTGGTCATGGGTGCTCCTCTGA 
AGTGCTTTGGTCTGATAATGTGGTCCACTCAAGCCTCCATGGCCTTCACCTCTACAAGAAACATGAATC 
CAATAACTGTACTGGTGTCTCTGGATTTATGGCTTTTAAGAACTTTGACTATGGTGCCATGGTTCAGAC 
AGAGAATAGTGTGGACATACAGAATAT C ACT CTGGT AGACAATACTGTTGGTCTTTTGGCTATCACAT A 
TGTATCTTCTGCTCTCCTGAGCTCTGTCAGTACTGTACAGATTACACTTAGGAATTCAGTCATTGTGGC 
CACTAGCTCCTCTTTTGACTGCATCCACGACAGAAAGGCTCCTCAGTCAGCCAACTGGACATCAACAGA 
TAGAGC ACCTT CCAAT C CCAGAGGAGGC CGAAT CGGTATTCTGTGGC CTGTTT CTGC CT C AGAACCAAA 
TGCATGGC C CCAGGAGC CATGGCACAAAGTAAGGAGC CGT CATTCAGT CCCAGGAATTATGAAGCTT CA 
AGATGTCACCTTTTCTAGTTTTGTGAAGAGTTGCTATAGCAACGACCTGGATGTCTGCATCCTGCCTAA 
TGAGTATAGCACTGGAGTCATGTAC CCAATAACAGCAGAGAGGAC CAGAATGCTGGGGATAAAGGACAA 
AAACZ^GTTCTACTTTCCTGTATTAGAGTCCAGCAAAGACTTAGTGGGAACCATTTGTCCCACATTGGT 
CTG^TGAATAT CCAAGAAAATACCTCTT CACAGAT CTTGATGGGAGAACACTGGGTCTACCCCCAC C AGT 
TTCTGTGTTT CCAAGGACAGAGGAAGAGTGGACTGGAT CGTT CCTCAATACAGGTATATTCAGAGAAGA 
ACAGAi^TGCACATTCCGAGCGATGAACCAGGGCTT CTT CTGTAAGCAGACTGAG C CTAAT 

TCT CGATAATGTTGATGCAACTTGGACAATC C C CAAATCACACC CACTTGTAT CTGTTACTAATGGCTT 
. TGTGGACAC^TTTAGCATTGTGAAGGAC^GTGATTTATGCCCTCCCACAAGCTCTCTGTCTACTTTTTA 
TTCCATCTTGCCGACCAGACAAATG^ 

TCTTCTATTGGGAAACCAAAGAGCCTCCAAGCTCATCTTGGCTGTATTCTACAATGAGATTCAGAGCCC 

TCATGTITTTCTTAGACAAGAGCTTTATTCCACCTACTCCATTAGAGTCAGGATTTT^^ 

GC C CT CTGGTGC C AACTATTTTGACAT CATGAATAACCTCTTGTATGTTGTC CTGCAAGGA.GAGGAGCC 

TGTTGAAATA<^TT CAAGTGTTTC GATT CATTTGGCTTTGACTGTGACATTT 

CTGGGAGAGAGCAATGCTTGAAAGCCTAAGTGACTTCTTTGAGA 

TCTTGAGATGCCTGGCAACAAAGAGACCTTAGAGGCCATTGCAAACAGTG 

TTGC C CAT CTGTAACTTGTGGTGGCCCTTCTATCAGATATGGT CAACGTAGACCTCTCATGGCAGAAAT 
GACAT GACTTAAGATCACACCAGCAACAACT CTGGAAACTTTCTCAAAGGTGATTGT CATTGAAGTTGG 
TGACGTGCGAAAGATAAGGAAC7VGTGAACCCATTCAGTCCTTACCAAG 
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GAAC CA.GGTTATCACTGCTCAACAGACTGGAG CTCTAGAAAATGTCCTAGGTATGACTGTTGGGGC CCT 
ACTAGTGACTCAGTCCAAGGGAGTCACAGGATATAGAAATGCAAGTAGTTTAATAACTGGGAACCTGAT 
ATACAC C CGGC C CT CAGAGCTTTC CAT C CTGGTGCAGCCTTCTGATGGAGAAGTGGGAATAGAATTGC C 
AGTTCAGC CACGGCTTGTCTT CCTGGATGAGAAGAATGAGAGAGTAGAGT CTTTGGGTCT CC CCTCAGA 
ACCCTGGATTATTTCAGTTT CT CTAGAGGGAGCATCTGAAT CAGTGCTTAAAGGGTGTAC CCTGG CAGA 
AACACGGGATGGCTATGTGACCTTTTCTAGATTGGCTGTCTTGATCTCTGGGTCAAACTGGCACTTGTT 
TTTTAC TGTTATAT CCCCT C CAGGTACTAATTTTACAGCTCGATCAAGGACCTT CGT TGTCTTGC CTGT 
GGCTAGCAAGGAGAGATCAACTATCATCTTGGCCTTGTCCCTGTGCTCAGTGGCATCATGGGTGGCTCT 
GAGCTGTCTCGTTTGCTGCTGGTTTAAGAAAAGCAAAACCAGAAAAATAAAACCAGAAGACATATCTGA 
ATC C CAGGCTAAGGAACAAAAGAAGAATAC C CATAATT CCT C CAAACCCAGAGGACTACAAGCAAAGAC 
AGCAAAAGAGAACACTTTGATGGGAGAAGATATGAGAATGAAGGTCATGCAGGGAATGCAGAGCCAGTT 
T CC C CAACACTCAATGGATGGAGTGT C CAAAAGGAAAGTTAGC CGCCTTGCTGTCACAGGGGAAAGAAC 
AGCTACAC CTG CC CCAAAGATT C CCAGAAT CAC CTGTGTT C CAGGATCT CTTGCTCAGCAGCTGACACT 
GCAGGAGCCTGGGAACTGGCAGGAGGCCCAACAGCAGTTGCTCAGATACCAGCTGGCAGGCCGCAATCA 
GCTGCT C CTGTTACGC C CAGACCT CAGGCAAGAGAGGAAACAGGGTCAGGAGC CTAGC CAGCTGGACAA 
AGGGAGTGACTGCACTGGACTGTCTCAAGAGAAGGCCACTTGCATTCCCACTGAGACTTTCGGCCTCCA 
CACT ACT C CAC CAGAAACC ATC CAGTAACAGCTGTGGGCATGGAGCACTGTGGGCATTTGTATGAAAAG 
GAGAAAATGTTCAAAATTATTTCTGCATTGTAAATGGGAGAGGAGAGGTCTGATCTGTTTGGACAAATA 
AGGAGAATGTGAACTCTAAATCTTTAAACTTTAATATGGAAGACAGTCAGGCAAATGCTTGTAAACTGA 
GATTGTAAT CAATCATGTC TCTTGTAC CTCTCATTGATCCTAC C CAATT C CAGCAAATAATAGGACCT C 
AAAAACTTGCTGATATTTTCTGGGGTTCAAACTGGTTACGTTGCAGCCAACTTAATACCTGTGCTATAA 
ATACTGAATTT CAGTAAGCAGGAACTGTGATTAAGATT CCCTATAGTCAACACT CAGGATGCTTTAGGC 
TTGT CTTATGGAAGACCTGTTATAGCTTTAGTTAGC CGATGTTGTATCTGCAGTGCTATAGAAATACC C 
AGGAGATATTTTACACCAATGTTTACCCTTCAAACAGAGTTAACTTAATAAAAGTTACTTGTAGATTTT 
AAAAAAAAAAAAAAA 
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Intron 1 

GTACTGTTTGAT CCAGAAAAGTCTCTGCTCT CTGTTTTCTAGGTGTTGTATCTCTTGTTAACGTT 65 

CTGGTGAACAAAAGGAAGAAATGGGAGATCTATAGTAGTGCCTTGCAACTTTGTCCCTCGATGTC 130 

CCAAAGGAGAAGCTGAGAGGGAAGGGAGGAAGAAGGGAAGAGGGAGTGAGAGCAGAGAGAGGAGA 195 

GAGAGAGAGGAGAACAAAAAC^VTGACTAAATAAATGCACACAGCTCTCCTCTGTGGTTGAAAAAT 260 

TTTAGTTATGAGAAATAAAGAGAGTCTGAGTTTATTTTTAGGAAGAATTAGTGGATAGACTAATA 325 

AAAAATTACATTTATAATTGACATGAAAAAGATGCAGTTC CAAATGTAGGGTTTTAAGAAAAC CA 390 

GTGTGCGAATGTTTATTTCTATTGTTCTGAGCTTGGGAGTAGGCATTAAGAAGAAATGTTAAAAT 455 

CACGTAGCGAGATTGAAAATAGACTCTCCTGTGCTGAGTATATTTTGTCTGTGTAAGAAGCAAGT 520 

CAGATCTCATGCTTTTGGACTAAGCAGCAAATACGCTTGGGTACTTTTCCCTATGTGGTAGATGT 585 

ATTCTGAAAGTTGTATATTTATAAGTTGAATTCTATTTCAAATAGACGTAAAAGTTTGGGAATTT 650 

TGCAACGAAAAGGAACACTTGCTGAATCCAC 715 

TAGCCTCCACACTTACCCTATCTGGTAATGACTCGGGGGCAGGTACATAGATTGTTTGTTTTCCC 780 

AACTTTTAGTATAGTGCTTAGCACGTAGTGGGCATACAATAAATGTTTGCAGTGTTGAATTAAAT 845 

AGAAATGATTATAGAT TT C CAGCTGT CTCAATCAGAACATGCC CGTAAGGTGAGTTTATTGCAAA 910 

GTTTTTGCAGATTTTTTTTTTGAGGGGGGGAGTATATTGTAGCTTTTATATTTTCAGAAATGATG 975 

TAACT ACTT CTGCT AAT CTCAGTGTTTTCTTAAAAATATAAATTAAATGGC CAGGTGTGGTGGTT 1040 

CATGCCTGTAATCCCAGCACTTTGGGAGGCTGAGGCAGGGAGATCACTTGAGGCCAGGAGTTCAA 1105 

GAC CAGTCTGGCTATCATGGTGAAAACCTGT CTCTACAAAAAATTCAAAAATTAGCCGGGTGTGG 1170 

TGGCGCACACCTGTAATCCCAGCTACTCAGGAGGCTGAGGCATAAGAATCACTTGAACCTGGGAG 1235 

ATGGAGGTTGCAGTGAACTGACATCATGCCACTGCACTCCAGCCCAAATGACAGAATGAGACCCT 13 00 

GCCACACACACACACATACACACACACTTTGTGTGTGTGTATGTGTGTGTGTGTATGTAGGTATG 13 65 

TATATATATATTAAATATATTTATATATTTATATGTAATAAACATAAACATAATTAAATATATAT 143 0 

TAAACGTGTATTTAGTAGTACATGTGGGTGTTTAATT CTGTAATTTT CAAACTTTCAGAAAATTT 1495 

CAGAGGCACTATTTTTAAGAGGATT TTGTCGATGC CCTCTGC CATGAGGTGCTGGAGAGCAGCT C 1560 

AGC ACTTTCCTTAGAGCAGGCATGAGAGTGAAAGCTGTTCATCT CAGATT AGGTAAACC C AGATT 1625 

TAGGGTATTCAAATATGTCTTCATCCACTCCAATGTACTGAGCGCTGTGTGGGACCTTCACACTT 1690 

TCACACTAGGAAGGCTGTGGAAATAGAAGACTGGTT CCTGGGTCT CTTCAAGGAACGTGCCGT CT 1755 

GGAAGAAGAGGCCTATGTGTGCCACATTATCTGGTCTAGGCTCTACAGCACGGAAGTTAGAGGTT 1820 

CAGGGGGAAGGTGGTGAGCACTGGAATGGCGGAGGAAAGAATCAGCTGAGGAGGGGCTCCTGAGC 1885 

AGCACC^CGAAGGTGCGCCAGGATCTCCTGAGGCCACGGAGAGAGTTGAGGGCATCCAGGAAGGG 1950 

ACCAGCAGGGGCCAAGGCAGAGGCTGATGTGTGGAAGGCTTGTCTGAGTGACGGTGAGAACGGCG 2 015 

TGTGGCTGCAGTGTAGGGTTCAAACTGGAGAGGAGCACGAGGGAAAGCTGGACGCCAGCACAGGG 2 080 

CAAAGCAAAACAGACTTCACCCTATCACGA 2145 

T CAGCTTCTGTT CAATAATGAGTTAATGAAAGAGGTTATTATTTAT CCAGCTTAAAATAAGTTGG 2210 

TGGGACAAGGAGGGCAGAGTGGGGATGATTTTATGCAAGGT T CTCAGATGATCCTTTTCT C CTGA 2275 

GCTTGGAAAAATGGTGGCTCCATTTGAAGACACTAAGGCCATGTTTATCTCATCTCCTTAATTTC 234 0 

CCAGGTTTCAGAACAGCAAAATAATCGTATGTAAACAAAATGATAATTTTTTTTTGCTTTTTTTG 2405 
TTTTTATAAAG 2416 (SEQ ID NO: 5) 

Intron 3 

GTAGGTTGGGGTTTTACCAAGTGCACATTTCTTATGTATTGACCCACAATCCTAAAGACTATGAG 6 5 

TCTTTGGTTTTCTTCCTTTTCTAAGGACAGGTGTAAAAGTGGGCCTGAAGGGAGACGAACAGACT 130 

GACCAACTTCTGTCTTTCTAGATACTGGCTTGCTAATGTCT^C^GAAGCAAAGCACAGCATACCAT 195 

GACAACTCTGTGTCCACTTTCCCATTCCAGGCTGTGGGATGGGACTCTGGGATTTCTACATGAGA 260 

TGATATGGAAGTGTGTAGC^TAGTGCTCAGCAATGCATCTCCCAGAATCTTGGCTATCTTCCTTA 325 

AAGACAGT C CT CTACTTGGGAGCTT CTGCACCATTGCTTAGCATAT CCAT CCCCAGCAGAGTAAA 3 90 

GAGTAAATCTGAGGGCTGAAAAATTCTTTTCTGGATTTAGGTGAACCTGAAGAGAGAAAACTCTT 455 

TCATAAAATCATAAATGAGAAAACT CCTTTATACAGCATCTATGAGGAAATGAGGAGTATTAATT 520 

TAATCCTTGGGCAAATTTAATGTCTTACATTACCCCCAGGATCTTAGCACAGTTTCACA 585 
TGTGTCAATGACAATTCTATGCAGCCTGAGATTTCTTTCCCTTGTGTTAG 635 (SEQ ID NO: 209) 



10/ c ni fl?^ 

PCT/US03/02038 



10/*ni 



WO 03/062453 PCT7US03/02038 



31/47 
Figure 13 -page 2 

Intron7 

GTAAGTGTGTGTTTGTTTTTGTGTTTAACTAGTTACATACATGCT^ 65 

CTTCCCTGATGGCAATAAATTGTAAGCAGT^ 13 0 

TGGTCCCTCATGAGCTGGGCTTCT^GCAAACTTTGTTAATGTAATTGCAACTGGTCAATTAAGTTG 195 

GTCCATTTATTTACTGACAACTAGTCACTCTGGGCTCAGTGTGAAATGAACTGTAATTGCATCTG 260 

TGGATTTTCTTTTTGAATTCTCACCCTTCCTTCCTTTGTTTCTCAGCCTGAAATAGATTCTTTAT 325 

AAAATGATGTGTAAACCC2\AAAGCCCATTATAACTTTCTTATTTGGTTGTTATCGATTTGTGCTT 390 

T AAAAATTGT ATTAGTGGGGT CAGAGGAAAACATGGAC ACAGGTATTAAAAG C CAT AGAGC TTTT 455 

AATGTTTTCTGGGAATGATTAGGATGTCAACATGACTTTCTTGACTGGi^ 5 2.0 

TTACT AT TAAAT CAT CCACACTGGAGAGAGAGAACAAGACAAAAAGTGTT GAAAT TGTAGAGGCT 585 

GTAGGAAGCTCTAAGGAACTGTAATCATTCAACAAATGAAGCAAT^ 650 

TAGAAGGAAAATGATCTTACTATATACTCAGCTGCATAGATTCCATACATGGTGTCTAATTTTTC 715 

CTTCACTCTGGATGGGTTGGGGGCATCCTCTTCTGTTCTACTCCATCTGTCTGATTTTGCCCTAG 780 

TTGAAGAGAATATGATCTTATTACT CTCAGGATTGACATTT CTGGCATTAAGCAATGGTCAACTT 845 

AC CTTACAAGAAAACTACTCTTCTTGTGGGGGGT AGAAACTC CTACTACAT CCTTGGGAATGTGC 910 

CATATTTTGCTAGGTGATCC CATCT CAGCCTTGGT CTGGGATACAGC CTTTGAAAGGGGGAATAA 975 

AGGGATAAATGCAATATTATCTCTGTGTAGAATCAATATA 104 0 

TTTGGGAAGGGAGAACTATTTTCTGTTTAGTGTGAAAGCATGAGCCATGAGTGCATCCCTACTCT 1105 

CTGCTGAGAATTTGACTTGACATCCGCCTT CAGCCAC CTGCAATAGTGCAGAAAAATCCAGAGGA 1170 

GAGTGTTCATAGCCATGTTTCCTCTGAGTTTTGTGAGGAATGTTTATTGGGAGTATTGCACAATT 123 5 
ATCTCTTGTCTTTTGTTTTCATTTTTTTTTAAATCCAG 1273 (SEQ ID NO: 2 10) 

Intron 14 

GTATGTTGTAGGAAAAGTGGGAGCCCACATCAAAAGCACCTTTGCTAACCTAGGTGAGGCTAGGA 6 5 
GACAGATAAGGAAGGTATG^GATTTCGAGGAATTTATAAG 13 0 

GTTTGACAGTATTCTCAATCAGTGTTGGTGATGCTAGTGCAGGGACAAATTTTGAT^ 195 
ATATGTATATTTTCCACAACTTAGTTTACAATCTGTTTTGGAGATGATTATCAACTAGAACATTG 26 0 
AGCTGAGCAGGCCAGGAGACTGGAAAGACAGCAGAGTAAAACA 325 
GGTAAAACTAACAT CTGGTTGATGC CAAAGAAAGATCCAAGAATTTGCCCTTTGGGTACATGAGG 390 
GAGCAAAGCCTAGGCAGCATGCTGTAGGAACAGC CTTC CAGTGCTGAAGGTCAAC C CAATGGCCC 455 
TTGTATAGTAGGGGAAGCTCTTGCGGGTTCTGTGAGACATTGTTTTCAGTAGTAGTGATGGCATC 52 0 
ATGATTCTAATTTTCCTGTTTAATGGTGTGTAATTCCTTTAGTCTTTTTAGTCCCTTCAAGGATG 585 
TAGC CAAAATTTCTAGTATT CTAAAGTAAACTTAAAAATATAAAAGCTTGAAAATTGCTTAGACA 650 
CACTGTTTCCTTAGTGTGTTCTCAGTGTATATGTTGAAGGATGGATCCTTTACTGAATGATGGAT 715 
CTCTTTTCCCTTTGAAATCCTTCTTAGAGAGGATGACTGTGACTCATGAGTGTGAATTTCAGTCA 780 
GTCTGTGACCTC CTCCAAAT ATTTTAC CATTTTATTAGGTTGGTGCAAAAGTAATTGCGGTTTTT 845 
ACCGTTGAAGGTAATGGCAAAAACCGCAATTACTTTTGCACCAATCT 910 
TGTGTAAAGAAAAGCTTAGAGAATTTTTAGGCATTGAATAAGCCAAGTAGGGTTGGTAATCTGTG 975 
AGCAGGAAAGTGTCT C CTGAAGCCTTACTTACTAGGTACTTAACCATGAGTTTATGGTTTTAAAG 1040 
TGGCAGTTAAGGCTGGATGCTATGGCTTGAGCCTGTAAT CCCATC T ACTTGGGAGGCTGAGACAG 1105 
GAGGAT CGCCTGAGT CTAGGAGTTTGGGACTAGGCCCTGTCTCTAAAACGTAAAAAATAAAAAAT 1170 
TAGCCAGGTGTGATGGTGTGCACCTGTAGCTACTTGAGAGGCTGAAGTGGAGAATTGTTTGAGCT 1235 
CAGGAGTTAGGGCTGCAGCGAGCCATGAT CACAC CACTGCACT CCAGC CTGGGCAACAGAGTGAG 1300 
ACTCTGTCTTTAAACAAAGAAACAAATAAACAAAAATGTG^ 1365 
CACCTAATAATT CATATTTATCATAGTTTTTAACGACCATTTAATAATGTT CAAAGGAAAATCTT 143 0 
TCAGCTGC^TTTGGTGTATTTGGGAGTGTTAAGGAGTGAGTCAGCCTACCCCAAAAGGCAAAAGA 1495 
ACATTTTGACTTCTATAGTAAGTGTTGCAGGGTATGTCCCTTTAACTGCCATTTTGAGGAACCAC 1560 
AAGCCAGGTAGTAACTAATTTTCCATTCCCTCTCTCATTAATCTCTTTAAAATCTAAAAATTTTA 1625 
AATTAAAAAATTAAAATATTCATTTATTGGTAAGTTAATATAATTATATTGTGGACTTTTAAAGT 1690 
AGTTATGTTTGAAGCTATTTTTAGGTATGAAATTATCTCAAAAATAAAGATAATGTATGTACATT 1755 
AAAGCAAAATTTAAAAACATCTTTATATTGATCATCTGAAGATTTAAGAAAATAGCATTATCAGA 182 0 
AAATATTCTTGGTATTTATTTACAGAGTCTAATCAGTTCTTTAACTATATCTGCCTATAATATTA 1885 
GGTTGCTGGAATTTAAATATTAAAAATATTATCTTTTAAAAAATGTTTTATGAAATTGCCTGTAA 1950 
T CTT CTT CAAAGTTGCATTTGATGGGTTTTAATTTGAAATTGTTGAC ATTTTGAATTGACGCTTA 2015 
TCTGTGGATCATAATATTTTTAATTAGAAAAATGCTCTCTGCAGGTGTTGAGGTAGCTGGTAAGC 208 0 
TCAGAGCAAATTCTCATAAGCAATCTGTCTTTATTTCTAATAATAAGAATAGTATTTACTAT^ 2145 
TTGAGCTTCTACCATGATCGAGGGCTTGGAATAGCTGTGTTAGGTGGTTT 2210 
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CGTATAGCTGTGTGCTGTGGCTACAACTTTCCCAAACATC^ 2275 
CAGTGTAGAGATGTATTGGGCTACTGAGACTAGGCAGGTGCTATATCTCTTTCTAGAATATTCTG 2340 
GACAATTGTGTGGCATAAGAATCAGGTTGTT C TTCTTT ATTAC CATAAAAGAAGACAAAGT ACAA 2405 
GGGCAGTCATTTGTTGGTTCAGTGATTCAGGCCTTGGTTACTCTTGCTTGACTCTATGTTCTACT 2470 

TTACAG 2476 (SEQ ID NO: 211) 
Intron 22 

GTAAGGAGTGGCTTTTTTACACCTGT CC CTTCT CCTAAGAATGCTTGTTGGC CTTGAGGGACACA 6 5 

GGTGTGACTTTTTTCAGGAAAAGCTACCTGTCTTGTTGCTTAAAGCAATGTTCTCAATCTTGAGA 130 

ATGCAGCACCAGATTCACCTGGAAGTATTGTTAAAATTACTGGGCCTACT 195 

GCAGTAGGTTTGGGGAAAAACCTGAO^TTTGCATTTTTAATAAGTTCCTTGGTGATGCTGATTC 260 

TGCTGGTCTGGGGACTACGCTTTGAGAACTAATTCCGAGTCAGTTAGTTTAAAAATAGTGGCATT 32 5 

TTGTGCTGTTCAGAGGTTCACATCACCACTGTTTTGTTTTGTTGTTGTTCTTTTCATTGCATTCC 39 0 

TCATGTGTTAATCTTGTTGAAATCCTTTGAAATGAAATGTCTAGAGAAGAAAAATAGCTATTTCT 455 

AAGAACT CAC CAC CAGATGGCACTAAAG C C C CATAAGCATTGCTT CATAATAACCATTT CTAGC C 52 0 

ACAGTTTACAAAGCAGTAACTAAGGAT CAGGCTTCTTCTAAGCTT CTGGAACACATGTAT ACTCT 585 

AATTTGTTCTTTTAATTTTTCACCTAAACCCCAGTAGAATGGGAAGAATTGAG 65 0 

GATGTATGTATATGTATATGTGGGTGTAGGGATATATATATTCACAGTGTATATATGTGTATACA 715 

CATATATGTCTAAATATACAGT CATGCACCACATAACAATGTAT CTGTCGGTGATGGACCAAATA 780 

TATGATGGTGGT CCT ATAAGATTATACTAC CAT ATTTTTACTGTAGCTTTTGTATGTTTAGATAT 845 

GTTTGGAT ACACAAATATGTAGCATTGTGTTACAATTGC CTACAGTATT CAGTACAGCAGCAGGC 910 

TTGTAGCCTAGGAGCAACAGGCTATACCATATAGCCTAGGTGTGTGGTAGGCTGTACCATCTAGG 975 

TTTGTGTAAGTAAACTGCATGATGGTTGCACAATGATGAGACTGT CTAAGGATGCATTT CTTAAA 1040 

ATGTAT CCTCACTGTTAAGTGATGCATAACTGT ATAGGTTTCTTT CT CTCATCTTTTTCTCATAT 1105 

GTTCCAAAATGAGTTCTCGTACCTACAGCATGCTGCAATGGC^^ 1170 

TTTGAACCCGTGCTTTACTTTCCTTGACTAAATGTTTGTTCCATGGTCCTCTGGGCAGGAAAAGC 123 5 

AATAAAAC CATCCATTGAAAATGAAGAGGTGAGACAT CTT CAGTGGCAGAGAGGAAGC CCAC CAT 130 0 

ATCGGTAGGCTCTAAATGCCAACGTTTTTAGCTCTGAAATGATAGACACGAATTAAGTTACTCTG 1365 

AAATGATTCTCACATCGAGTGGTCCTGAAAACTCCCTTACTGAGTTTCCTCAGGTCCCTTAGCTC 143 0 

TTTCTGGAAGGCTGCAGCCTAAGCAAGACAGGACAT CCTTCAGACAAGGTC CT CCT AGGTGC ACA 1495 
CC C CAACC CAGACGTTAATACTTTGTTTCTGACGTGC CACAG 1537 (SEQ ID NO: 212) 

Intron 23 

GTAAAGGGGTGATTGGGGTTGCAACAATTCTCACTCACATAT 6 5 

CAACAT CCTGGGAGGTTGT CAGACAGGTGATAATATTAAAGCTATTTTATTTATTTTCCAGTGTC 13 0 
TGATUVGTGACATTCTTAAAGTGAAAGATTTGGAAAGGGACTTATTGTTAATGCTACCCCAACCTT 195 
TACATTTTGTAGATGCGGAAGATGTATAGTTGTGGAAACTGAGTGGATCAGCTTCCTGGGACTGT 260 
TGTAAGGAGTTAACCACAAACTTGGTGGCTTCAAACAGCAAAAAATGATTCTCCCCC^ 325 
GGCCAGAAGTCCAAAATCAAGTTGTCGGCAGGGCCACACTCCTGTGAAGTATTTGCTCCTGCCTC 390 
TTCTGGCTTCTGGTGGTGGCTAGCATGTCTTGGCTGTGGCCATATCACTCC?^CCACCGCCTCTG 455 
TGGTCACGTTGCTTCTTCCTCTTCTATCTCAAAATTTTCTCTGCCTCTCTCTTATAAGGGTACCT 520 
ATTATATAATTGTATTTAGGGTCCACCTGGGATAATCTAGGACAGATTTTTCCTCTCAAGACCCT 585 
TAGCCACATCTTTTGCCATATGCAGTTTATTATTTTGCTTTATAAGTTAACATTCATATTTTCTG 650 
GGGATTAGGCCATTAGGCCATCTTTTAGGGGGTTCACCGTTCAGCCAACTACACT 715 
AAAAGGTCATACAAATAGCTGATGACAGGGTCCAGTTGTGAACCCAGGTATTTGATTCCTGGGTC 780 
AGTCCTCTTCTTTCTAGAGTTTTATAGACCAAGATACATGGTAGCCATGGTCCGTCAGAGTTAGA 845 
CTTAATGGTGACACCATGTACTATGGAGGATTTCAGTGGTCCCAACAAATGTAGAAAG 910 
AGATGCAATTAGAGTAGTGTTTGTAAATCTTCAAGAATACATACAATGCAC^^ 975 
AGAAGTGATAATGATACGTTACTTATTTGGTAGAAACATGGGGAATCAGAAGC^GGCTCAGTAG 1040 
AACTTGAGAGGGGCTGTATAAAAGTTGGAACATGGTCCAAAAGTCTTTTGCCCTCCCAAGCAGAA 1105 
AGTCC CTAGGCCTGCACAGGAC CTTCTTGGGTGAGAGGAACAGAGTGGTATTTTTATTATAATAG 1170 
GGTGACTCAGGAGAAGTCGAAGATCCCTAGGTGTTGATTCTGGTAAATGGGGGAAAAAACATCAA 1235 
TCGTGCCCTGCCTCTATGAGGCTCATTACTGTGCTATTTATATTTGATTTTACTTCTCATGGAAG 1300 
ACAGCTC^TCCGTAGAGACTTCCTGCTACTGATTTCTATCACTGATGATCCTCAGATCACCGCCT 13 65 
GCAAAACAACTGGGAAAGT CAGCCTTGGCCTGGCCTTTTGAATGATGATGGATCTGAAACT CTGT 143 0 
ATAAATGTAGAAACATGATTTGTAAAAGGATAACAATTTCGTT^ 14 95 
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ATTTTATTAGCCCTTCAGGGCAGCGTGGAATTCAAGAGAAATGCTCTTGAGTAGGTAGAAGGCAA 1560 
CCTGTGTTTTCATGTAAACCTGTCTTTCTGCATTGGCAAGCTTCTGCATATGGTTGGGTTTCATT 1625 
T TCTT CAT CCCTAAAGTAGACATTAGGATAC CCAATGAC CCAC CTCACAGGGCTGCTGGGAGCAG 1690 
CTAATGAAATGGGAACTTCTGGTAGAGCACAAAGCAGGGTTCAAATACAGAGAGCTGTTATTCTT 1755 
CTGTGGGGACATGGAATGGGGAAGCAGGTGGTTGGGCTTAAAGAAAATTCTAATAGAGAAACTGA 1820 
AGTTAAATGCCAACATTCCTCAGCTGGGCTGGCCAAGTTTTTATGGGTGTCAGCTGCTGTACGCC 1885 
TCCCTCACTCCCTGTGAAAAGTGGCCAATTTTTCTCTGTTCACAGGGCCAGCTAAATTTTTCCAG 1950 
GGAAGATCTAATATTTAATTATGCTTTCAGGCATTACAAGGGTGTGTGGAGTTTACATTTTGAGT 2015 
TGACAGTTGAGATGGTTTTATCTGACATGGCTGTGCTCTCTGATTGCTGTGTGATATGGTATGAG 208 0 
TGAAAGATAGTGTAATATAAAAAGTGGGCATCTACTTGTCTTTACCTTAGGAAAAAATGGTTTAA 2145 
TTATGGCTGGGGATTCTACTGAAGTTCTACTTTGACAGAAGGGTCTCCTGAAAATTTGATAGGCA 2210 
TCCTAGTATGTATCGTGTTATCCTTGAGGATGAAACTCTGTAAGGTGGATTAATTAGTGTCTGTG 2275 
TTTTCTGTATCAAAACCTTCTCTCACAG 23 03 (SEQ ID NO: 213) 

Intron 28 

GTAAGTGGATTCCTTTCATATCTCTTTCTCTCTGGGTGAGTGACCACTGTTAATATAACATTTTC 65 

AGTGAAT CACTTC TTAGAACTAAATGAACTGATGTAAACTT CT CATTATGATAGTATGCTTGTAG 13 0 

TAGTTATATTGT CTGTTTTGCTATGAAGTGGGAAACTGACCC CAC CAATGGAGCTTGTAATTAAC 195 

ATCAATTAATTTCTTAAAAAGAAGACAACCAGGCAGTTCTGGTCTGTACTGTCAGTAAGTATTAG 260 

TGACACGTAACAAATAAATTTAGCTAGTGCACATTCTGGGTGTTGGCTTGCAAGGCTTATATATT 325 

TCT^AAGTCTCCCTTCTCTATTAAGCAAACAACAAATAACT 3 9 0 

CTAGTATGGGTATTAATTGTAGAACTTAGAAACTTCTAGAGTGTGTGATTTCTAAGAAATATCTT 455 
CTTAGTTATTCTCCATTGCTTCCTTTTCCCCTTAAAAACAAGTCCCTGACCTCTTCCTTTCCTTT 520 
CAATTAGTGCT ATATC ATGGC CTATTAAGGGATTTGAGTCTGGGT C CTT C CCTGGTACTGTTGGG 585 
GAGAGT CACACGCACTGCTGC CACTGAACTTTCT ATTTAGAGT TGACTTAAGCAGCAT CAACATT 650 
C CTAGCACACC CATGACCCC AAAATAAAGATCC C CTGGGAGATAAGTTT C AAAATATTCTTTGAT 715 
CACTAGT CCTACATTTTAAT CT CAT CTAGTT C CTTAAAT ATTATGAAAAGCTAGCTTTTATATGT 780 
ACACTAC ATTCAATT CCAATATGTGGTTGT ACTCTAATTTGTTTAACT ATT C CTTATTACCAGAC 845 
ACTTAGATAATTT CTAAATGTTTCTTATTGTAAACAACAGGGCTTTAAT CATC CTAATAACTATG 910 
TTTTGGGGGT ACATTTCTTTTCT CAGGATAAATTAATATAAATT CTAAAGCTTTTGATATGTAGT 975 
ATCCAGTTGTCTGAAATTCCCTTTCAAATTATACTCCCACCATCATTGTGCACGTGTGTGATTTT 1040 
TGACACTTTGGC CAATACTGGGTTATCACTTTATTATTTT AATATAT ATTTGC CATTTTAATGGG 1105 
TAAGACATGTAC CTCTTAATT TCTTTTAC CAGAGAACATAAAC ATTAATAAAAAATAAATTTTAC 1170 
TTTTGATCCAAGTGATAGATGCATAGGTTAAAAGGAAAATAGTAAATTATGTTTTCCTGC C CCTC 1235 
CTCCCCCTTCTTCAAGTCCCCCTTCCTGAAACAACTTTTAATTCTTTCAAATATAGTTACAATAC 1300 
CATTTTTATCTTAAATTAATAAAACCTGTTTATATTATTCTAACTATTTAGATGATGCTGGCAGA 1365 
ACCGGGTAGTATATTTTTTTCTTTTATAGTTCTTTTTTTTTTTTTTCCCCTAGAGTTCCTATTTT 143 0 
ATTTTCTAAACATGTCTTTTGTTTGTTCGTTTGTTTGAGACAGAGTTTCGCTTTTGTTGCCCAGG 1495 
CTGGAGTGGTACAATCACGGCTCACTGCAACCTCCACCTCCCGGGTTCAAGTGATTCTCCTGCCT 1560 
CAGCTTCCTGAGTAGCTTGAATTACAGGCATGCACCACCATGCCCAGCTAATTTTTTGTATTTTA 1625 
GTAGAGGTGGGGTTTCTCCATGTTGGT CAGGTTGGT CT CAAATTCCTGATCTCAGGTGATCCACC 1690 
CGCCTCGGCCTCCCAAAATGCTGGGATTACAGGTGTGAGCCACTGTGCCTGGCTAACATGTCTTT 1755 
CTTAT AAGTTAAATC CAAT AT CTTTTAAAAAAAGTTC CATCGTAT CAGTCATTCATTTT CCTTGA 1820 
AGCTATCTCTGTTCTCCTGTTTCAATCTAGCCTGCTTATTTTCTAGGTTTATTCTACAGATTTTA 1885 
TCCTAGTACTTACTTTGATTGCTTT CTTGAGTAGTCACTGTTTCTTGGGTTT CAGATATAT ATAT 1950 
ATATTTAAATTATTATTTATTTTATGAGATAATAACCATAAGTACATCCTATGAAAGAGTGTGTC 2 015 
ATAGAGAAATTTTCTGAGTTCTCACATGTCTGAAAGTACTCTCATACTTGATGGATAGTTTAGCT 2080 
AGGTATAGACATTTATTTGAAATTGCCATATTTTTGCAGAAACAATTGGTGTGTTAATTGCAAAT 2 145 
AATTCTTATTTAC C CCTTACAGCATGT CATTATGCATCTAACACTGCACTTGC CTACTAGT C CAA 2210 
GCACTTATCACTCTGTGTTGTGGGTGTGGGGGCAGGATGGGGAGAGTGTGCAGGGTTGTAGAGAA 2275 
GAGAGAGACTTGGAAGTAGGAAATATACCCTTTAGGAACAACTTTCTTAAAATTAACTTTTAAAA 2340 
CTAATTCTATATGGAGTTCTCTTCCCTTAAGTCAGTCCTACTTTAAAATAAAACTGAGGTTTAAT 2405 
TTTTAAAATTGATTTTTCAG 2425 (SEQ ID NO: 2 14) 
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Intron 32 

GTAAGTCAAGCAAATAAGAC 6 5 

TGGAAAGTAGAAAATTAACACAATCTGC CTGATGGAAGGAAAGAGAAGCCCACTGGCTT CTTACA 13 0 
ATCCCAATTCCTTCCTGAGGCTTGTCTTTGTTATGCTCTGTTTATGAAGATTTTTTTTATTTTTA 195 
TCAAGGAAACTGTGCATATTCTCTAAATGTTTGATTGTATTTTAATTTGATGCATTAACTGGATT 260 
TGTATTTTAAATTAAATAACACCATTTGTAAGAGCTCATAATTTGATCATTTAAGAACGTAAATG 325 
CCTTCACCTAGTTTTAGACCCTATCTGCCAATTTGCGTTGTTTAA7VATTTATTAAGTATGATTAA 390 
ATTTTTATCATTTTGTAATATTTCACAGGTGGACTCATATTTCAACAATAATAAGCCAAATGCAC 455 
AGAACAATTAAATTGGTTGGACTGTTTTCTCCGTTTAGATATACCAAAAATTGCCTAGCCTTTCC 52 0 
CTCCAGTGAAGAAAAGCTTTG?^TTTCTAT 585 
ATTTGGTTGTGATTTAGAAAGTAAGGAAAAAAACTATAGAAACAGAATCTTAGACTGTTGGAGTA 650 
CTAACTAAGACATTTCTTAGAAAAAATTTGGTCTCAGCTTGGTGGAACACTGTGGGGACTAGGAT 715 
TTGGCTCTAGTCTATC^CTAATTTTGCTAATTTATGCTTGACTTTTCTGAGACTCAGCTTCCTTA 78 0 
TTTGATAAAGGCACTACT CC CT AAGATT CCATGTTTTTTTATGATGGAAGAGCAGGGAAATAAGA 845 
AATGCAT CTTAAACCAAAAGCATTATTTTTGAGTTAGTCAAGTGGCTAAGT AC CAC CTAGACCTG 910 
GTATGAAGGCAGTAGTGAGGGGAACTCTGT ATCTCAGTGTAAACTAGAAATGTGGACTGGTTTTA 975 
CTCATACAAATGTCCCAAAACATGTACAGTTA 1040 
AAAAATGGAAATT TCAAT AAAT AGGAAAATTGT CAAATAAATTGTAGCAGGGC C CTATAATGGAA 1105 
TTCTAAGTAGCTACTAAAATGAACTGGATCCATAGAGTTTTGAAAAAACATCTATGCTATACTTT 1170 
GAAGCAAAAAAGCAAGTTCCAGAATAATATGGATAGAATAATGCTTTGAATCAGAJ^ 123 5 

CTTAAAAATTCTGGAAGGAGCCATAAGAAACTCTATACCTGGGTACCTCCGGGGAGGGAGTCAGA 1300 
TGGTTGGGGGAATTTTTATTTTCATTTTATGGCTCTTTGAATAAAAAGTTTAAAAACTATAAATA 13 65 
AGCATTAATTTTCCATATAAAAATTGTTACATTAAAAAAAAACCT C TTTAACACAATAGGATATT 143 0 
GAATGTGATTGGAGTCAGACAAGGCCAGAGCCTAAGTGGAGAGGAAACTGAGGCC^GCAGCCACC 1495 
T CAAGCCAGTTGTGCGGATT CTGAGGATGTGAAAAGAAGAATGGGTAGTGAGGAAGCAAATGTTT 1560 
GAATTTTGAGTTGAGTAAAGAAGGGAGATTTGC CTGTATGAT CAAGAACTTGTACCTTTGTCTTT 162 5 
AAAG 1629 (SEQ ID NO: 215) 

Intron 33 

GTGAGTAAAGATGCC^CACACTVTATATTTTAAAGC^TATATATGGAAATGATATTCTTTGGTTAA 6 5 
TTCTATTTTTGTGATTAATGCTGTACTGACTACTAATTTCTCTATGTGTGCCTAGGAAAAGAATT 13 0 
T CTCTACTCCTCATCTAAAATGATAGTTAGAATCTGAGGC CACCTGTTAAAATGATTCATCATAA 195 
CTTTTGTCATATTAATATGTGAATGTTAGATGAATATTGAAACACTTATCACCTGTGTTCTTAAC 260 
TGCAGTCTTAGGATGACAGAGGAAGTAATTCTGAATTCTGAATATTAGTTTCAATGACAGCTATA 3 25 
GGAGT CATGGAGGAAACAAGCT CTTGGCTTTGT TCTGAGGTGAGGTTGCTGAAGACAT CTGCTTA 390 
TTGGAGGTACCAGTAAAGGGATGGAGATTTTCAAGCTGGATATCACTTGAAAATTAGCTTTGTGT 455 

. GTTCAGTTTTCGGTTTCTTATTATAGGCAAAAGAGCCAACACTCATGTTGTCTTCTTGTTTTGCA 520 
ATACTCACATAATTACTTATTTCTTATTCAGTAT^AACACCAC^TTGCTGACTACTTTAAGCTGC 585 
GTAGTGATCATATAAATTGTGGTATGAGAAGCCGTGTCTTTGTGGGGAAAGAGATGAGAGAGTAA 650 
GTTGCAAAGCTTGGGGATT CACAACACATGGTAATAC CCCACTGAGCTTCAGGAAATAAAGTCAA 715 
AAGGAAGAAATTAC TGTTATTACTACAGGACCTTACTACATTTGAGATAGCTCACATTTAGC CAG 780 
GTGATTACCTTATTTGCCTAATCATAAATCTTGTACCTGTGGA.CTTAACCGTTTACATACCTCCT 845 

. TTCTGTGTAGTGTTTAAGTTTTATTCCTAATTTATTTGTCTGCAACTTGAATGTGGGCTAAAGAT 910 
TTACAAAATGATAAAAGCACCAGATCATCT 975 
TTGTGATGGAAATTTGTGCTGTGTTGTCTTATACAAAGAGGAGAAGGAGGGGAAGGAGGAGGGGG 1040 
AAGAGGGAAGAGGAAGAAGAAGGGGAGGAGAAAAAAATTTTTGTTAAAATGCTAGAAATTGAGTT 1105 
TC CTATTAT CATCATGTATATAAACACATT ATGGAAGAGAGATAGAGTCCACAATGGGAAATTTA 1170 
AGATAC^TAGAAGATTGAAGTTGAAAACA^ 1235 

- AGAGTGTTGCAGAGGGTATGTGCAAAATTAGTGCTTGGTGAGGAATAAATGAGAGATAGCAT 13 00 

CAGAAAGCTAAGACTGC^ 13 65 

* AAGCTTT CATATATACACTGCT CAAATTAATATACTTTTAAAAGC CCCGTGTTATTATTTCAAAA 143 0 
CACTTAATTTC^CTAGTATAAGATAAAAATCAATGATGTTTC^GGATCAGGTAAGTT 1495 

. TTTif^AGTTTTATAACTTCTTGGGGAAGAATAATAAAATAATTATTGTGTTTAGAAAGATTTAGAA 1560 

: AAGi^CTCAAGATTCCATGA 1625 
GCCACTAGGTGTCACGAAA 1690 
AATTTAACTAATTTTCCTTT CATAAAAAAGTCTTTTAAAAGACTTTCAAT CACAATGTCTAAAGA 1755 
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TTGAGAGGAAATTGTGAGAGCCAACTCCAGAGGTTTCTTACTTAAGATCCAAGATGGGATTTGGG 1820 
GATTCTGTTAACCCGCTGAAACTGGATGAAGCATTTTGAGTGTATGACTGTGTATTTTTTTTTTT .1885 
TCCCTAGGAAGTAGGTCTATAATGGACATCAAATGTCAAAGGGGATAGGTCTTAGACATTACTAG 1950 
AAACTACTACTAATTTCTCCATTTTCAGACAGGATTGAGTACAACCAAGTTAGCTAAAAATCACT 2015 
TGTATTTTTAAAGATTTTTCAGGGGAGAATTTCCCAGCAGCAACCCTTACAAGTGTTTCGCAGTT 2080 
GCTCTTTTCAGAGAAATCCATCCTCTGCCTAATGGATGCTCCCCTACTCTAATTTTTTCAACCTT 2145 
AATCAGCGGGTGGTTCTTTGGAAAGTGGAGTATTCTTAGTTCCTCTATGGCAGCAGTTCTGGAAG 2210 
TGTGCTTCCCAGAGCAGTAGCTGCAAGGGCCTCACCCGGGAGCTTGTTAGAAATGTGAATTCTTG 2275 
GGCCCTACTGAATCAGAAACTTTCCAAGTAAACATTTTAGTATCTCACTTTTCAGCCCTCTCTGA 2340 
AATCCTATATTCTTTCCTAATTTGAAGCCCCAAATGAGGAAGCTGTTCTATACAAGCAAGTTCTG 2405 
GCCAAATTGGGTAGCATCGTAAGATGCCTGTGTATCGTCTGATCCCATGTTTGTTTGTACAATTA 2470 
TACTGCAGTCTTGCTGGTTAATAAGCTTTCTGTTACCTACTGTTATCCCAAGGGGTGTGTGTGTG 2535 
CACGCACGCATTTCTACCATGGCTGTGCACAGCTGGACTTTCCTCATATTTATATGATTTCTTTT 2600 
TTTCTTTTGTAGTTTACTGTCTTACTCTTTTCATTTGTTCTTTTGTTTATTTCTGTTAACTTCTC 2665 
TCATTTACCAAGGTCGCTTTGAATTCTGACCCGTGCTTTGAGTTTTTTTCTTCAGTTTGACTTTG 2730 
TACCATAGAGTGATGTTTCACATTCCAGGTTACAGATAATGACCCTGAACTCAAACGTTCTTAAT 2795 
TATTGTTTTGTTTATGCCTGTGCCACAGAACTAATATGTTTTCTTTACATGTGTGGGGCAGGGGG 2860 
AGTTAAAGCAGGGGGCTCTACAAATGTGCTTTTGCTATTTTGGAGGTCACCCATTTTTACCATCC 2925 
CCACAAACTGTACTTCTAACCATAGGAGAAATTTCCTTTTTCTTGTAATGAGTTGCCAAAACATC 2990 
CTGTTAGGTGAAACTAATACTTTGTGTTTGTTTAAAATGAGCAAAATCTTTGATCTTTGGCTTTC 3055 
TTGCATTTATACCTTGAATTATACCACATGACATTTTCATGGAAACTTTAACTTTTCCATAAGGC 3120 
ATGGAAAGCTAAAGTGATTAAGGTCACGCAGCTATTTAGTGGCAGAACTTTGAGTAAAACCCATA 3185 
GATTTTGATCCCCAGCCCTGGGTGATTTTCATAATCCTGCTTGTCAATTTGCATCTACTTAATCA 3250 
CCTTTAATGAATTCATTATTTTATAGGTGTGGAGCTTGTTTTTATTTGCCTTAGGGCTTACTAAC 3315 
TGGAAAGTTCTTATGTTTTGTCTGTTCATACAAGAGTCCTACTGTCAGTCATTTTTATTGCTCTA 3380 
ATT<^TTGAAAACAC^TTCACAGCCAACCTCCTAGGTGCCAGGTGCTTTAGAATATAACAGCAAC 3445 
AATAGTACTATTTGGGCATGATTGCATAACTACAAACCCTCCCCCACGTACTTATCTCATGTAAC 3510 
CCTTGCCACAGCACTGTAATGAGGCGGGGAAGCACAGGTCTAAGCCCACGGCCCTTGATAACCTC 3575 
TGTTGCATTACCCACATGGGCAGGCTTGCTGCAGAGGAAGCAGGCTACAGAGATTTTTTTAAATT 3640 
TTCCCTCTTTATTAAGGTTTTCAGACAGAGCTGCTCCTAAACCATCTCATGTGGAGCTTTGTTCA 3705 
TCTTCTAGTTAAAGATCATTCCCAGTCTGCCTCATGATGCTTTTTATATGTGGGTCATGACTCAG 3770 
AAAAAAATGGC CTGAGAGTCAGCATGCTT CAAATACTTGCTTTTTAT C TCTATAACATGCTAATG 3835 
TTTATAATTATGTGAAAATCAAGAAATTCATAAACTTATCCAAGTCAATAAGACAAACAACCCAA 3900 
TAGAAAAATGGGC AAAT GAGAGAAACAGGAAT T T CACAGAAGAGAAAACATGAGTTGT TAC CAAA 3965 
CATAAAAAAGTTGGTCAACTTGGCCAGGCACGGTGGCTCATGCCTGTAATCCTAGCACTTTTTGA 403 0 
GGCTGAGGCAGGTGGATTGCCAGAGCTCAGGAATTCAAGATCAGCCTGGGCAACATGGTGAAACC 4095 
CTCTCTCTGCTAAAATACAAAAGATCATCCGGGGTGTGGTGGTGTGCACCTGTAGTCCCAGCTAC 4160 
TCAGGAGGCTGAGGCAGGGGAATTGCTTGAACCCGGGAGGCGGAAGTTGCAGTGAGGTGAAATTG 4225 
TGCCACAAGCCTGGGCAACACAGCGAAACTCTGTCTCAAAAAATAATAATAATAATAATAATTGG 4290 
TCAACCTAAAAGTAATGATTGAAATGCAGATTAAGACGACAGTGAAATGCCATTTTACACACCTG 4355 
ATTGGCAAAAATTAAAAGTCTGATAATTTCAAGTGCTTGTAATTATATGGAGTAATGGGAACTTA 4420 
CAAATATGGCTGGTAGGAATACAAAATGGCACAACTACTTTGGAAAACAATATGGCACTATCTTG 4485 
TAAAGCTGAACTTGTACCTACTCTTTGAATAAGAAATTTTCTTGATAGGCATGCACCCTAGATGA 4550 
AATTTTGTACGTTTTTAGTAGCAAAAGCTAGGAAATACCAAAAAGTTCATTGATAAGAGAATAGA 4615 
TAAATTTATTGTGGTAGTTTCATGCAATACAATATTGAACAGCAGTGAAAATGTATTAACAATAG 4680 
TTATATGTAGTAATGTGGATAAATCTTGAAAATATAATATGGAATGAAAAAATCAGACCCAAGAA 4745 
TATTTTATCATGTATCATATTTTATAAAGTTCAAAAAGAAGGAAAACTCAATCTCTTGTTTAGGA 4810 
ATACAAATGTTTGTGATAAAACTATTTAAAAAATGCCAAGTGGTTATTTCTGAGAATGAGGAGGA 4875 
AAGGGACGAACTTGGGGAGAAACACACAGATTTAAGTGTATTATAAGTGTTTTATATCTTATGTT 4940 
GGCTGGGAAATTCACTTGAGTTTTTTTTATGATGATTATTCATATTTTACAAAAATGATACTTGT 5005 
ATTTTTCTGTGTACATTACACATATACAATACATTTTAAAAAAAGTAAACTGCTAACTTCATATT 5070 
CCTATTGGTCAAAGGAGGACACAGGAACTTCATTTGTGAAACCGACTAGAGGCCTTAGGTTCTCT 513 5 
CTGTGGTTCTTTCCTAATGGTGACTGTTTCCTGCAG 5171 (SEQ ID NO: 216) 
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Intron 43 

GT AAGATGTT CAGCT CTAC CAGGAAGAC (^GAACTGAGAGGGCATAAAGTT CTTT CT CAAT CAGG 6 5 
GGTGTCC^CCTTTTGGCTTCCCTGGGCGAC^TTGG 13 0 

CACACATAAAATGCACTAACGCTAATGACAGCTGATGAGCTGAAAAAAAATTGTAAAACAAATCT 195 
(^TAATGTGTTAAGAAAGTTGATGAATTTGTGTTTGGCCACATTCAAAGCCATCTTGGGCTGCAT 260 
ACGACCTGTGGGCTGC CAGTTGGACAAGCTTGCT CCAAAAGTT CTTTAAGGTGGCAGCGTTAGTG 325 
GTGGTGTGGTATGAAATGTTTACTTGCTGCATATTAGTATCAAGAAAATAATTTATAATTTTGCA 390 
TTAAACAAGTACTTTAGGATAAATGTAAGC^TTCCTCTCAGGATTTCTGGAAACACTTTTTTGAA 455 
GCAATAGGTAATGGAGCAAAACAAAGTAGATATTGAT CGTTTCCTGGTCAT CTAGGTAATGCAAA 520 
CTAAAATATCTCCCTGAACTACCAACTCTGGGTGOTGATTTTTGTCTCACTTGATTCCAATACC^ 585 
ATTTCTTTTTAAACCTTGACTATCTTACTATGTTAATGTGGCCATATTTTGTCCTTTAAGAGTGT 650 
TCAAAACTGAGACATGAGGTGTATAAGGTCATGT 715 
AACCTTGATTTTTAAAATCCCATTATTTAGTACAACTTAACATTGGTTTCCCTTGGCACATTTCT 78 0 
GTTTAAACATTTAAGAAATTAATTTTTGAGGGGACAATGTAGCTGTAGACCTGAGTGAACAAGTG 845 
CAT CAGAGTAGTGGCAAGCCATTTCATTT C CCCTTTTCTAATTATTTTATC C CATGGAT CTTCTA 910 
TGAAAGGAGTTAAGGGCCTCACTGTTTGAGGAAACTCCTCTCA^ 975 
GAGTTTCTAAGGAACT CAGAGGATGAGCTTCTT T CT CACTGATCAT CTGTTTTTAATTACCTTCA 104 0 
GCTGAATAAACC CTAGTAAAAGTAGTGGTTATCTC TTCTTC CTTAGATTCTTAATTATGTTTGTT 1105 
CCAAGCACAGCACT^CJVCACCATTTTAGGTGCCTAATGGGAGTGGCTAATATGCCAGTAAGCAA 1170 
AGGAAGCAGAACTACACGGACTGTAGGAAC C CAGATCC CAGAT CCAGGACAGCTGGAGCTGCATT 123 5 
TAACTTGTTGGTCACTACAGGCCAAAAATCCTAATGATAATTAGGATTTTTTTGTTGTTATTTTA 130 0 
AACTTTTAATTTTAAAATAATTTCAGAC TTACAAGAAGCTGCGTAAATAAAAGAGTTC CTATGTG 1365 
CCCTTTCTATGTCTGTAAGCTTTTGGGCTTAAGAAACCATGTTTTTGTGTACTTTTCTGGGTAGC 143 0 
ATAATGTTGACTACATCAAATGCCTGGAGGAAAGTAAACCCTCAGGGTTGCCCAGCTCACCCTGC 1495 
TGTGTGAAGCTGGAATGTCCTTGTCTCACTGGGTAGTATGTGGTCTGCTGGACGGAGTGCTGGCC 1560 
ACTGGCTGACAAGAAGAAGGGTTGAGCTGGCTGCAGGTGCAGAGAACCAGAGGGTAATCTGAAAA 1625 
GCTGTGGGTGGTGTGAGCCTTTGCAAAATGACCTGTAGAATAATACCCAGTCAGCAATGGAAAAA 1690 
TTGAGTCTGCAACTAGCTGCTTGCTCTCCCTCCAACGCTTTCCATTTCCCTTCATTTACTTTCTT 1755 
ACTCTTGTATCTGCTTTACAAAATTAGAAAAAAAATACAATGCATATGTTTTGAGAATGGAGTTT 1820 
TAGGTTAAACTGGTAATGTAGATTCATTAGGTATATTCCTGACATATTTATCCTTGGTGACCTTA 1885 
AAGTTCTTTTTTTTTTTTTTTAAGTTTTTTTTTCTTTTATTATTATACTTTAAGTTTTAGGGTAC 1950 
ATGAGCACATTGTGCATGTTAGTTACATATGTATACATGTGCCATGCTGGTGCGCTGTACCCACT 2015 
AACTTGTCATCTAGCACTAGGTATATCTCCCAGTGCTATTCCTCCCCACTCCCCCCACCCCACAA 2080 
CAGTCCCCAGAGTGTGATGTTCCCCTTCCTGTGTCCATGTGATCTCATTGTTCAATTCCCACCTT 2145 
TGAGTGAGAATATGCGGTGTTTGGTTTTTTGTTCTTGCGATAGTTTACTGAGAATGATGATTTCC 2210 
AATTTCATCCATGTCCCTACAAAGGACATGAACTCATCATTTTTTATGGCTGCATAGTATT CCAC 2275 
GGTATATATGTGC GACGTTTTCTTGATGCAGT CTAT CATTGTTGGACATTTGGGTTGGTT C CAAG 2340 
TCTTTGCTATTGTGACTAATGCCGCAATAAACATACGTGTGGATGTGTCTTTATAGCAGCATGAT 2405 
TTATAGTC CTTTGGGTTTATATACC CAGTAATGGGATGGCTGGGTCAAATGGTATTTCTAGTT CT 2470 
AGAT CCCTGAGGAATCACCACACTGATTTCGACAATGGTTGAACT AGTT^ 2535 
GTGTAAAAGTGTTCCTATTTCTCGACATCCTCTCCAGCACCTGTTGTTTCCTGACTTTTTAATGA 2600 
TTGCCATTCTAACTGGTGTGAGATGGTATCTCATTGTGGTTTTGATTTGCATTTCTCTGATGGCC 2665 
AGTGATGATGAGCATTTTTTTATGTGT TTTTTGGCT CCATAAATGT CTTCTTTTGAGAAGTGTCT 273 0 
GTTCATGTCCTTCACCCACTTTTTGATGGGGTTGTTTTTTTCTTGTAAATTTGTTTGAGTTCATT 27 95 
GTAGATT CTGGATATTAGCC CTTTGTCAGATGAGTAGGTTGTGAAAATTTTCTCCCATTTTGTAG 2860 
GTTGCCTGTTCACTCTGATGGTAGTTTCTTTTGCTGTGCAGAAGCTCTTTAGTTTAATTAGATCC 2925 
CATTTGTCAATTTTGGCTTTTGTTGCCATTGCTTTTGATGTTTTAGACATGAAGTCCTTGCCCAT 2990 
GCCTATGTCCTGAATGGTAATGCCTAGGTTTTCTTCTAGGGTTTTTATGGTTTTAGGTCTATCAT 3 055 
TTAAGTCTTTAATCCATCTTGAATTGATTTTTGAATAAGGTGTAAGGAAGTGATCCAGTTTCAGC 3120 
TTTCTACATATGGCTAGCCAATTTTCCCAGCACCATTTATTAAATAGGGAATCCTTTCCCCATTG 3185 
CTTGTTTTTCTGAGGTTTGTCAAAGATCAGATAGTTGTAGATATGCAGCGTTATTTCTGAGGGCT 3250 
CTGTTCTGTTCCATTGATCTACATCTCTGTTTTGGTACCAGTACCATGCTGTTTTGGTTACTGTA 3315 
GC CTTGTAGTATAGTTTGAAGT CAGGTAGGGTGATGCCT CCAGCTTTGTTCTTTTGGCTTAGGAT 3380 
TGACTTGGCGATGCGGGCTCTTTTTTTGGTTCCATATGAACTTTAAAGTAGTTTTTTTTCCAATT 3445 
CTGTGAAGAAAGTCCTTGGTAGCTTGATGGGGATGGCACTGAATCTGTAAATTACCTTGGGCAGT 3510 
ATGGCCATTTTCACGATATTGATTCTT CCTAC CCATGAGCATGGAATGTTCTTCCATTTGTTTGT 3575 
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ATCCTCTTTGATTTCCTTGAGCAGTGGTTTGTAGCT 3 640 

TAAGTTGGATTCCTAGGTATTTTATTCTCTTTGA^ 3 705 

TGGCACTCTGTTTGTCTGTTGTTGGTGTATAAGAATGCTTGTGATTTTTGTACATTGATATTGTA 3 77 0 
TCCTGAGACTTTGCTGAAGTTGCTTATGAGGTTATGGAGATTTTGGGCTGAGACAATGGGGCTTT 3 835 
C CAGATATACAATCATGT CTTCTGTAAACAGGGACAATTTGACTTCGTCTTTTC CTAATTGAATA 3 90 0 
CCCTTTATTTCCTTCTCCTGCCTAATTGCCCTGGCCAGAACTTCCAACACTATGTT 3 965 

TGGTGAGAGAGGGCATCCCTGTCTTGTGCCAGTTTTC 403 0 

TC^GTATGATATTGGCTGTGGGTTTGTCATAGATAGCTCTTATTATTTTGAAATACATCCC^T<^ 4095 
ATACCTAATTTATTGAGAGTTTTTAGCATGAAGGGTTGTTGAATTTTGTCAAAGGCCTTTTCTGC 4160 
ATCTATTGAGATAATTCTGTGGTTTTTGTCTTTGGCTCTGTTTATATGCTGGATTACATTTATTG 4225 
ATTTGCGTATATTGAACCAGCCTTGCATCCCAGGGATGAAGCCCACTTGATCATGGTGGATAAGC 4290 
TTTTTGATGTGCTGCTGGATTCGTTTTGCC^GTATTTTATTGAGGATTTTTGCATCAATGTTCAT 4355 
CAAGGATATTGGTGTAAAGTTCTCTTTTTTGGTTGTGTCTCTGCCCGGCTTAGGTATCAGAATGA 4420 
TGCTGGCCTCATAAATTGAGTTAGGGAGGATTCCCTCTTTTTCTATGGATTGGAATAGTTTCAGA 4485 
AGGAATGGTACCAGTTCCTCCTTGTACCTCTGGTAGAATTCGGCTGTGAATCTGCCTGGTCCTGG 4550 
ACTCTTTTTGGTTGGTAAGCTATTGATTATTGCCACAATTTCAGATCCTGTTATTGGTCTATTCA 4615 
GAGATTCAACTTCTTCCTGGTTTAGTCTCTGGAGAGTGTATGTGTTCAGGAATTTATCCATTTCT 468 0 
T CTAAATTTTCTAGTTTATTTGCGT AGAGGTGTTTGTGGTATTCT CTGATGGTAGTTTGTATTTC 4745 
TGTGGGATCGGTGGTGATATCCCCTTTATCATTTTTTATTGCGTCTATTTGATTCTTCTCTCTTT 4810 
TTTTTCTTTATTAGTCTTGCTAGCAGTCTATCTATTTTGTTGATCCTTTCAAAAAACCAGCTCCT 4875 
GGATTCATTAATTTTTTGAAGGGTTTTTTGTGTCTCCATTTCCTTCAGTTCTGCTCTGATTTTAG 4940 
TTATTTCTTGCCTTCTGCTAGCTTTTGAATGTGTTTGCTCTTGCTTTTCTAGTTCTTTTAATTGT 5005 
GATGTTAGGGTGTCAATTTTGGATCTTTCCTGCTTTCTCCTGTGGGCATTTAGTGCTATAAATTT 5070 
CCCTCTACACACTGCTTTGAATGTGTCCCAGAGATTCTGGTATGTTGTGTCTTTGTTCTCGTTGG 513 5 
TTTCAAAGAACATCTTTATTTCTGCCTTCATTTCATTATGTACCCAGTAGTCATTC^GGAGC^GG 52 0 0 
TTGTTCAGTTTCCATGTAGTTGAGTGGTTTTGAGTGAGATTCTTAATCCTGAGTTCTAGTTTGAT 5265 
TGCACTGTGGTCTGAGAGATAGTTTGTTATAATTTCTGTTCTTTTACATTTGCTGAGGAGAGCTT 53 3 0 
TACTTCCAAGTATGTGGTCAATTTTGGAATAGGTGTGGTGTGGTGCTGAAAAAAATGTATATTCT 53 95 
GTTGATTTGAGGTGGAGAGTTCTGTAGATGTCTATTAGGTTCGCTTGGTGCAGAGCTGAATTCAA 54 60 
TT CCTGGGTAT C CTTGTTGACTTT CTGTCTCGTTGATCTGTCTAATGTTGACAGTGGGGTGTTAA 5525 
AGTCTCCCATTATTAATGTGTGGGAGTCTAAGTCTCTTTGTAGGTCACTCAGGACTTGCTTTATG 5590 
AATCTGGGTGCTCCTGTAT TGGGTGGATATATATTTAGGATAGTTAACTCTT CTTGTTGAATTGA 5655 
TCCGTTTACCATTATGTAATGGTCTTCTTTGTCTCTTTTGATCTTTGTTGGTTTAAAGTCTGTTT 5720 
TATCAGAGACTAGGATTGCAACCCCTGCCTTTTTTTGTTTTCCATTTGCTTGGTAGATCTTCCTC 5785 
CATCCTTTTATTTTGAGCCTATGTGTGTCT CTGCACATGAGATGGGTTTC CTGAATACAGCACAC 5850 
TGATGGGTCTTGACTCTTTATCCAATTTGCCAGTCTGTGTCTTTTAATTGGAGCATTTAGTCCAT 5915 
TTACATTTAAAGTTAATATTGTTATGTGTGAATTTGATCCTGTCATTATGATGTTAGCTGGTGAT 5980 
TTTGCTCGTTAGTTGATGCAGTTTCTTCCTAGTCTCAATGGTCTTTACATTTTGGCATGATTTTG 6045 
CAGTGGCTGGTACCGGTTGTTCCATTCCATGTTTAGTGCTTCCTTCAGGAGCTCTTTTAGGGCAG 6110 
GCCTGGTGGTGACAAAATCTCTCAGCATTTGCTTGTCTGTAAAGGATTTTATTTCTCCTTCACTT 6175 
ATGAGGCTTCGTTTGGCTGGATATGAAATTCTGGGTTGAAAATTCTTTTCTTTAAGAATGTTGAA 6240 
TATTGGCCCCCACACTCTTCTGGCTTGTAGGGTTTCTGCCAAGAGATCCGCTGTTAGTCTGATGG 63 05 
GCTTCCCTTTGAGGGTAACCCGACCTTTCTCTCTGGCTGCCCTTAACATTTTTCCCTTCATTT^ 6370 
ACTTTGGTGAATCTGACAATTATGTGTCTTGGAGTTGCTCTTCTCGATGAATATCTTTGTGGCGT 6435 
TCTCTCTATTTCCTGAATCTGAACGTTGGCCTGCCTTGCTAGATTGGGGAAGTTCTCCTGGATAA 6500 

TATCCTGCAGAGTGTTTTCCAACTTGGTTC^ 6565 
CGTAGATTTGGTCTTTTCACATAGTCCCATATTTCTTGGAGGCTTTGCTCATTTCTTTTTATTCT 663 0 
TTTTTCTCTAAACTTCCCTTCTCGCTTCATTTCATTCACTTCATCTTCCATCGCTGATACCCTTT 6695 
CTTCC^GTTGATCGCATGGCTCCTGAGGCTTCTGC^TTCTTC^CGTAGTTCTCGAGCCTTGGTTT 6760 
TCAGCTCCATCAGCTC CTTTAAGCACTT CTCTGTATTGGTTATT CTAGTTATACATTCTT CTAAA 6825 
TTTTTTTCAAAGTTTTCAACTTCTTTGCCTTTGGTTTGAATGTCCTCCCGTAGCTTGGAGTAATT 6890 
TGATCGTCTGAAGCCTTCTTCTCTCAGCTCXSTCAAAGTCATTCTCCGTCCAGCTTTGTTCCGTTG 6955 
CTGGTGAGGAACTGCGTTCCTTTGGAGGAGGAGAGGTGCTCTGCTTTTTAGAGTTTCCAGTTTTT 7020 
CTGTTCTGTTTTTTCCCCATCTTTGTGGTTTTATCTACTTTTGGTCTTTGATGATGGTGATGTAC 7085 
AGATGGGTTTTTGGTGTGGATGTC CTTT CTGTTTGTTAGTTTTCCTTTTAACAGACAGGACC CTC 7150 
AGCTGCAGGTCTGTTGGAGTACCCTGCCGTGTGAGGTGTCAGTGTGCCCCTGTTGGGGGGTGCCT 7215 
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CCCAGTTAGGCTCCTCGGGGGTCAG 7280 

AGATCTCCAGCTGCGTGCTGGGAGAACCACTGCTCTCT^ 7345 

GTCTGCAGAGGTTACTGTTGTCTGTTTGTCTGTGCCCTGCCCCCAGAGGTGGAGCCTACAGAGGC 7410 

AGGCAGGCCTCCTTGAGCTGTGGTGGGCTCCACCCAGTTCGAGCTTCCGGGCTGCTTTGTTTACC 7475 

TAAGCGAGCCTGGGCAATGGTGGGCGCCCCTCCTCCAGCCTGGCTACCGACTTGCAGTTTGATCT 7540 

CAGACTGCTGTGCTAGCAATCAGCGAGA^ 7605 

TATAATCTTGTGGTGTGCCGTTTTTTAAGCCCGTCGGAAAAGCGCAGTATTCGGGTGGGAGTGAC 7670 

CCGATTTTCCAGGTGCCGTCCATCACCCCTTTGTTTGACTAGGAAAGGGAACTCCCTGACCCCTT 7735 

GAGCTTCCCGAGTGAGGCAATGCCTCACCCTGCTTCGGCT^ 7800 

CCTGCGCCCACTGTCTGGCACTCCCTAGTGAGATGAACCCGGTACCTCAGATGGAAATGCAGAAA 7865 

TCGCCTGTCTTCTGTGTCGCTCACACTGGGAGCTGTAGACCGGAGCTGTTCCTATTCGGCCATCT 7930 

TGGCT CCT CCGGTGAC CTTAAAGTTCT AATT CTATTTTCATTAGCCTTTAGACACTAGCACAATT 7995 

TCTAAAACATGGTAGT TGCTCAAAAAAAAATGTATTTAATATAACGAATGAAGGTATAAAC CTAT 8060 

AACGAAATTATGTGGGGGAAGAAAAAGGAAAGTAAAGAACAAGTTCCAAAGTTCTAAAATCATTT 8125 

TGATGACTGAAAAATAAGTTTAGTCAGTGGAAGCATTTAGATTCTGTTGGGCTATCAGCATTAAA 8190 

TCTTGCAAAGTCTAGTCCAGTTTTTCAGTTGTGCCATTGGCTTTCTGTTATTCAGTCTTTTTTTG 8255 

CATTCTATTGTCTGTGATGTGCCATTACTTAAAGACATAGGTGGTAACTGGGTATACGTGAAAAA 8320 

AACCTGTGTTCCCTAGGCGAGTCTCAAACTCTTGGTCTCAAGTGATCTCCCCACTTTGGCTTCCC 83 85 

AAAGGATTGGAATTACAGGTGTGAGCCACCATTCTTGGCTGAGTTAGTGTTAATTGTGTCCTGTA 8450 

TGGATGATATACAGAGTACTTTGAAGAACATATTTTAGAAATATACCTTTATTCCAAAGGGATAA 8515 

TAAGGAGGCTTCCACAATAACAAGGTGTGTGTGTATGTATGTGCATGTATTTGTGTGTATGTGTA 8580 

TAATATGTGGAACAGAAAGAGATGTGATAGAAAATTGTGATTAATTAGGATTTTTCTTTGTTGTT 8645 

ATTTTAAACTTTTAATTTTAAAATAATTTCAGACTTACGAGAAGCTGCATAAATAAGAGAATTCC 8710 

TATGTGCT CTTCAT CTAGCT CCCT CCAATGATAACATAACGAT AACCATAGTCATGGAGCTGTAC 8775 

GAAGGCCAGGACATTGACATTGGTATGATAGTATTAATTAAACAAATGTATTTATTTAGAC 8840 

AGAAGATGGCCTAATCTTCATGTTTGGGCAACCAACTCTGAAAGCCTAAACTCTCTCTCCTCACA 8905 

TACCTGAGTCTGAC CTTGAAATCT CTGACCTGGAAGGTAGGTAGGCAGGGGAAATGATTCTTAAG 8 97 0 

TCTGTGCAATGGTTTGTGGTTTTATATTATTCT CAAATTGCCCTGATGGAGAGCTGGGAC CAAAC 9035 

TCTCAGCCACAAC^TAAGGAATTGAGCTGGGCTTC 9100 

T CAAC CTGGCATGATGCAAGTAAATTT CAAATATGATATTCTT TTTTAGTTTTGATGTTCAC AGG 9165 

TGGTCTGCTTCTCTCCCTGCCCAGCCTGC^ 9230 

AAAAC CTGAGCTTTGTACCTT CTTGCCAGTGAGGACC CATGGGTGATAAGTGCTTGAGT CTCCAG 9295 

GGGCCTGTGGCATTCCCTG&n?ACATT^ 9360 

GGTGGTGGTTCTTTTGTGTATCACCTGTAGCTTCTTAGAGCGCTTCACCCTCAGGCTGTCTTCCC 9425 

TCAGCAGCTCCAGCTCCGGAGTCTAGGACTTCT 9490 

CTGCATCTTTC CAGAAGACATAACCTGTGTGAATCTGTTCTCATT CTCTCTGGTTGGGAAGTCTT 9555 

TGCTCTCAAACAGCAAGGGACTGTTCACTTCCAGAGCTCAGAGTCTCCCATGTTTATGTAGGTGT 9620 

TGGAAATTTCCTATAACCAGACCCCTGTTTAGGATAGTGCGTGGAAAAACTCTGAAGAAGAGCCC 9685 

TTTGGAGACATGCATTTAATTTGAGGAGAATTTGTTCTGGTTTGTGAATGAATTTTGTAAGGAAT 9750 

TCTGTTTAAAGGCCCAACCTCAGTTCTCAAGCTOT 9815 

GCTGCCTGAAGGGTTAACTCACTTTTTTTCTAGTGACTATAGATGTACACCTCAAGGAGCTGGCT 9880 

TACTTGGGCAGTTAATTTCT CT CTGGAATTTCTCTTGCTTGAATGTC CATAATACATTGAC TTCC 9945 

GCAAATAATTGATTTCCACACAAAATTCCCTG 10010 

GC CTGCATAAATATGTGGTTTTTC CTCATGAATCATTTGTAGCATACACAATTGGAGTTGAGAGT 10075 

AAGAAGGGCCAGGAAGGAATGCGATCTGACTGTTAAAGTGCTTCTTTTGTAAGAAAAGTGAGTCT 10140 

TATCAGCTAACAGAGGACCAAAGTTGCAGTCTCCTGCCCACCTATAAATGCGCTTGGAAAGTGTT 10205 

TATATGTGATGACCGAGATGTGCCATAAATGCT^ 10270 
ATTTATTCAGGGAT^CACGTGCTTTCTGAGCATCTGTGCTGGCAAAGGTGATGAATAAGGATGCA 10335 
GTCCTTGGAATATATTTTTTAAATTTAAGAATCTTTTCTTTCCTCATAAAATCTTGGTAATGAAA 10400 
TAGCATTTCCTTGGTAATGAi\ATAGAGCTGTGTGGACAAGTGAGATGATCACTTTTAGCTTCCAG 10465 
TC CACATTTCTCATTGTATACTTGCAGACAAGGTGGGTGTTTAAGAAGCC CC CTTCTCTGGC CCT 10530 
CGGTTCTTATGTACCGCTGACCTTTCCCAAGGCTCGTGGATATAGAGAGACACACCTAGAGAAGG 10595 
TGGAGTTTCACTTCCCTGGGGAAAGTTTGTGTTGTGTAATCGTGACTGAGAACAACAGCTGTGGT 10660 
ATTTCTTTGTATATTTAC^UVGGGCTGAAGAGATACACTGGGC^CTTATATTTGCCAACTAATA^ 10725 
CAGTGATT CTTCTTGAGGC GAAGAAGGAGGAGTGCATACTCTGTTTTCT^ 10790 
TGAGATAGCTGATTTAATGCT AATAAATGTTTTTTTAATGGGAATGCCTGATGC CTCAT CTAATG 10855 



WO 03/062453 



39/47 
Figure 13 -page 10 

GTTTTAAATGATATC^TAGTTTCCTAGTAAAGACTATTAAAGCATTCTTATTGTAATTAACCAT 1092 0 
GTTTTCATATTTAGGCTTGTCTTTCCATCAAAATTTGGAGATGGGATACTGGAAAATGAGTGTGG 10985 
GTTATTTTGCTAATATGTGACTCTAGTGTAGACTATAGACCAAGGTTTCTCAACTACGTC^TAT 11050 
TGACATTTTGGGCTGGGTAATTCCTTGTTGTCGAGCCTATCCTCTGTATAACAGCATCCCTGGTA 11115 
T CTATGCACTGAATACCAGTAGCCCTCTT CTCTCTTCTTCAT CCT CCAAGTTGTTACAATAAAAA 11180 
ATGTATCCAGAGGCTGTTAAATGTTCCGTAGGGAACAAAGTC^TCCCTGATTGACAACCACC^CT 11245 
CTAGACTAGGCCACCCTAAGACCATTGAAGTCTTAGAAATGGACCTGATTCTTTGAAGTCGTGTT 11310 
GGCATCTTTGAT AGTGATTCAT CTTAATATT CAGTGATATCCAAAAGTCACTTTTGGTGAGCACC 11375 
CTGTGGTAGGTGAGACATGTGATTAGAATTCTAAGTGCTTTTAGGAAATTGGAGAATTGCTCAGA 1144 0 
CTC CAAAATAATGAAGTGCAGGAGTGAC T CGGCCAATTAGTC CACAAAGGAACAAAACAT CCTGT 11505 
AACCGAATGAAAAATGAGGAAGAAATGGCTGT CTATTTACAAATACC CAGGGTAAGAACCTTTGG 11570 
GACCCACAGTGAATTGAAGCTAAAGCTAAATAAACAGCCCGGGGCAATTGTGTCAGTATGTGCTG 11635 
GCCTCCCTGACCAGGTCCTGGCTGCTGCCTGCTGGTCAGGCTTCTAGTTTCAGGGGGAACTCTGG 11700 
CCCTGACTCACACTTCCCCCAAAACTGAAGGCCTCCAGGGGTTGAGGCATTGGTTCTTTCTGTCA 11765 
CACAAGGCAGGGAATTGGGCGTTATTGGGTTAAGAGCAATCTTTTTGAGTTTTCTCCCCCATACT 1183 0 
GTCTTTGCTTGGCTGAATGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTTCCTTGTGGAA 11895 
CATGTGGTAGATTCAGGAAGGAATAGGGTCTTTAAGTTCTTCTC CTGTTGGGGGTGG CGCTATAT 11960 
TATCACTGCCAGTGGATCAGCCATGTTCAGAGAGTTACCCTTAATAATACCTAAAGTTGGCTGGG 12025 
CACGGTGC CTCATGC CTATAATCC CAGCACTTTGGGAGGCC AAGGTGGGCGGATCACCTGAGGT C 120 9 0 
GGGAGTTTGAGACC^GCTTGACCAACATGGAGAAAC CC CATTT CTACTAAAAATACAAAATTAGC 12155 
CAGGCATGGTGGTGCATGC CTGT AAT CCCAGCTACT CAGGAGGCTAAGGCAGGAGAATCGCTTGA 12220 
ATCCGGGAGGTGGAGGTTGCGGTGAGCCGAGATCGTGCCATTGCACT C CAGCCTGGGCAACAAGA 122 85 
GTGAAACTCCATCTGAAAAAAGAAAACAAACAA 123 50 

GTTTTCCT TTCATTTGGAAATTAAAGT CAATAAAAATATTAGTCTAGAATGACTGAAGC CATAGG 12415 
ATGAAATGAGT TTACTTAGT CTAAGGATAAAGAAATGGAGAATAGCTACAAGTAAAAGGGT ATGG 12480 
AGT CCTCACT CTCAATCCAT CCTTACTGAGAATGTAGTAAAACT CCCTGAGCTGTGTGAAAGGCT 12545 
AGTGCAAGACCCTGTCCTTGGATGGGTCAGAACTTCCTCATTAAATTCTAACCCTTGTCTGCATT 12610 
CAGTCCATAGCCCTACTGTCTGCACTGATAGTAGATGACAACTGC^GATAATCTCAGTCTTTTCA 12675 
TCTGTCATTGCT CAAAATTCCTGTGT CAGAAGC CAGTCCT CAT CAACATGT CTCAGCCTTAATAA 12740 
CACTTGATCT CCATAATGCTGAAATT CCAGAACCCTCATCC TC CTTAAATGTACT CTT CAAAATG 128 05 
TCATGTCTTCTTCCTACTCTTGAGAAATGTCCCACACCCCTACCCATGTATGTCTCTGTGCACGC 12870 
TAAGCTGTGCATGCTTTTTTCC C CATGTGGTGAGAATGAGAAGGATTTTACATTCTCTGGATTTG 12935 
GGGTGTGAAAAGAGCAACTC CTTAGTTAAAT CTGGCCTGCAAGATGCT CTCCAGATTTGGAGAAA 1300 0 
TCAAACACTACCTCCGGTGCCTTAAGGATTAATTCACTTTTTTTTTTTTTCTGGTGACTATAGAT 13065 
GCACACCTCTAGGAGCTGGCTTACTTGGACAGTTAATTTCT CT CTGGAATTTCCCT TGCGTGAAT 1313 0 
GTCCATGATACATTGACTTCTGCAAAGGATGTTGTTCAATATGTTGTCTCCACTACTGGGGAGGC 13195 
CACAGCAAATGCCTGTTCTGTCCGTGACCGGGTGACAAGACTTTTCTTTGTACTCTCTTGTTTAT 13260 
GTTTCTTCACTTGCACCCTATTATTGGGCATCCTGCCTTTGGGTCCTACCTTCATTTCTCTACTC 13325 
TAGTCTCTAACTTTTCCAGACTTGGACTTGGATGGAGCTGGCTCTGACAACTATTTGCTCTGTGA 13 3 90 
CTTTGGGAAAGTTACTCAACAT CT CTGAGCTT CAGTTTCTTTGCTATGAAACTGTAATAATAATA 13455 
CAAAACTCATAAAACTATTGTAAAAATAAATGAGACTCTAAAATCCAGTACC 13 520 

CTTCTCTGTAGATTTT(^CTATGAGTGTTATTATTCTACTCATGATTACTTAAAAAAAAAATACT 13 585 
TCTAAGGGAAAAAAAAAAT C CACCATAAATATAACTTGCACTGAGCTGGGCAGCATTTTTGCTGG 13 650 
GTACCTGGGAATGGATTCTCCCCCTGATTTCTAGGTCTCTATCCTCCTTCAGTTTTCAGCAGTGG 13 715 
CTTCCATTTGCAGTGGGTTCCCAAAGCAACTCATGGCAAAAAAC^ 13 78 0 

TAGTGTCTCT CTCCTCTTTGAATGTCTCCTAGGAACGTTAGTAACCCTTAGCGTTACT CT CTCAA 13 845 
T CAC CTGTAGAGAAGTAGTTCTCAAAATGGGGTCAAAATATCACCT 13 910 

ACCTTGTGATGGCCAAGAGTAAAGAATACTGTCCCTCATCCCTTCCTCATCACCCCCCTAATAAA 13 975 
TCAAAATATCTAAAAACCTTTGGCTAATATACCCCCAGGTAAAGCCTGCCAG^ 14040 
TATTTGGTCAAATTTAAATTTCAGATAGTGTTTGCGACACACTTATACTAAAATATTTTATTTTT 14105 
TATCTGAAATTTAAATTTCACTGGGCATTCTGTGTTTTTATTTGCTAAATATGACAACTCTA 14170 
GGTTGCACACGAAAGTTTAAGAAACTGTTCCAAGGGGATGCTCACAGCGTAGTCCCC^ 1423 5 

CTGCATAGAGGGCTGGACTGAAGTATTGTTTTTTAAAGAAAGGCATTTAATGTCTTGTTGAGTGG 14300 
CACAGTGTCATGGTCCTTATGACTCCCCATTCTCTTTACTGTGACCCTAATGCCAGTGTTCAGGA 14365 
TGAGCT CTC CAAGCCC CATAGTTTGTGTTC C CGGGATTGAGTGACTT CCAAGGAGGATACTCCAG 1443 0 
A(^TTCCTTGTCTCGCACC^GCCAGGCC^TGGAAAACCCCCAGGTGAT(^GGATTGAATCATGTG 14495 
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GGAGCCTTGGAGACTCCCTTCATCTATGTAGCACAGGGCTTACA.CCTGAGCAGC CTATTCCTTAA 14560 

CTTCTGTTCTCGAGGTAGACATGGGCATCTTG^ 14625 
GATGCACGTGGGCACATAGGAAGTAGTCTCATAGCTTGATCGATTGGC CCTTTGTT CCTCCCACT 14690 
AATAGCATCACTGCAGTGCAGCAGCCTGATAGGGCCC CGATTTTTCT CAGAGTT CTTTCTCCCTG 14755 
ATGATAAAGAGAAGGCTTGGGAT CCTTAAGATGTGAGCGTGTGACACTGAGAGAACT CAGATGTG 14820 
ATTCAGGAAAGGAGAAATAGAAACTTTCAT 14885 
AGTTGAGGTTGCAAATTCAAATACTGCAGAGACTAGGCAGGGATCATAAATGAGTGAACCAGGAA 14950 
GGGTGAGGACTGTGGAAAAATGATCCACAGTCCAAGA 15015 
CTGTGGCTACTTCAGAGGAATTTGGGCTCAGA^ 15080 
TTGGTTTGAACATGTTGGAACCAAAAAAATATGAAC^ 15145 
TGTACAGTCTTAAACCTTTAGGAAGTCAGTTTTTTAATTTGT CTTAAGT CTATGTTACATAGGGA 15210 
TGAACATATTGTAGGTACTT CATTGAATTTATAAAGATAAC CT CATTGTGTTCAGTTTGATCAGA 15275 
ATTAGATCCCCAAACTCATATGGTCC^GAGAGAGAAGT 15340 
CATGAAATTATTTAGATAGTAAGACCTATAAAGAAATATCAAGGCGACTTAATAGTCTATTCAGG 154 05 
ACAAGAGCACTTTGAAGAGATTTGAGTTGTAGTTGTACTCAGTCACCCTGTCTTGGTACTAAGTC 15470 
ATGACTGGTCCAATCATGTGGCCTT CAGCCAATAGACAAATCGTTGAGTTGTT CAAAGAGC CAGA 15535 
GAGAACACATTGTGTAGGCTTGACTT CAAGGTACAC CTTTGCCTTGGAGAGCTACCATAT ACTGT 15600 
TGCATTCACCAAAGAGGAGAATTTTAGATGT CATGAGTAAACT CACTGTGGAAGCTTAGAAAGAG 15665 
GCTTGAGGATGAGATACCAGTTATTAAGATC^ 15730 
AGAAGAATGACAATATTTTTATTAGTTCATTCTCGCATTGCTATAAAGAAATACCTGAGGCTGGG 15795 
TAACTTATAAAGAAAAGAGGTTTAATTGGCT CATGGTT CTGCAGGCTATACAGGAAACATGGAAG 15860 
CATCAATTTCTGGGGAGGTCTCAGGT CT C AGGGAGC CTTTACT CACGGCAGAAGGCAAAGCAGGA 15925 
GCAGGCAACTTACATGGCAGGAACAGAGGCAAGACAAGGT^ 15990 
TTAAACTACCAGATCTCATGAGAACTCACTTACTATGGTGAGGACAGTACTAAGGGGGGACAGTG 160 55 
CTAAACCATTCACGAGAAACTGACCCCGTGATC CAGT CACCTC CCACCAGGCC CTACCT CCAATA 16120 
CTGGGGATTACAATTCAACC TGAGAT ATGGGCAGGGGGACAAATC CAAACCATAT CACTATTTTT 16185 
GTTCCCAAAAGGAAAAAAAAAGAATAAATGAGTCTATAATAGAGTTTTAATGTACTTTGGCAGAA 162 50 
AGTGAATATAAAATTGGGATGAGTACAAACAAGAGTC 163 15 

GGGTAACTATTTTTTAACTCTTCTTAATTTCTGTAG 163 51 (SEQ ID NO: 217) 

Intron 53 

GTGAGTAAAGGCACAAGGATTGCGAGCATGTTGAGAATTATATTCTGTGAGAAGGGGCTCTGGGA 6 5 
AACAGATGGTATCATCAAGCAGGTTGCTTAACAGAGTTTAGGGAGGGTTAAGGTAGTAGTGAGTG 13 0 
C&CCAGTAAAGTTGCTCTTCGGCAAGCT^ 195 
TTCATGCCCGTGTACTATCAGGCTGTTTCTGGTCCGCCTGCTACTGCTCATTCCAGGGTGATTTT 260 
TTACCTCCTCCAGGCTACAGATCAATTCTTCCTTTAGGTTTTCTTTGTGTCAGAATATGCCTTTA 325 
ACTCGCTCTTTCAGAAGATATCATAGGATGGATTTGATATCATCTGATCAACTAACTCACAATAA 3 90 
AATTTCAATTGTTGTCTTAAGATAATTTCCTGGGAAAACAGACTTGAAAGCAAAGCTATGTGCTA 455 
GCACTTTACTGGGACAAATAATCCCAAAGATGTGTGAGTGAAGGGAAAAGAAAAGTGAGGAGGAA 52 0 
AGGGAGGGAAAGCAAATACAAGGTAGCCACAGCTTCTCAAAGAAGCATGCTTGGTTTGCTTGGTT 585 
ATGTGGGATATCTTGAGAGAAGCCTTATTAGAACCACCATATCTTGGGACAATATGGAAGAGGTA 650 
GTGAGGAGAAGGCAAGCATCTCACCTGGCCCATTCCATGCCATTAACTCCTCTGACTTTGTTATT 715 

. TTTGTGGCTCCCTGGGTAGCTAGTGGAAGGACCAGAGAATCAGTAGGTGCTCGGAGATGAGGCTC 780 
CTCTTGCTGGGAAGTGGATCATGTTGTTGAOTCGA.CAGGACAGGCAGAATGGAATGGAT 845 
TAGTGTATTAACCAGATTTGGCTTACTTAAATAAAAAAACCTGAAATGTTATGGGTAGACTATAT 910 
ACTTAGAACTGTTGTAAGCAATAGGTATAAATGCTGAAAAGAGATGTACCCTGTCTCCAAAGGAA 985 
CTjUVTTTAGAACTTTAGTAAGGCATTTTACTTTGCCCCAGGAAGAAGATTGAAAGAGAATGCCCA 1040 
GAAAAAAAT CATAT CTTATTCCAAAGAAATATATCTCTGGTGGTAAGGAAATATTTAGATATCCT 1105 

;,TGXTAGGTAGCATGAAAATTT^ 1170 
AAAGGTTAAGTTACTGTAAAAATATTTCTGAAAAAATATGGTCAATCCTTTTCTTGAATACTTCC 1235 

-AGTGACAAAAAAATCAAAACCTCT 13 00 

CTTTTTGTTCTATTAAGCTAAAATCTATCTTCCTCTAATTTCTATAGGTTCAGGCTCTTCCCCTT 13 65 

. GAGCCATT CAGGACAAGTATCTT ACTCCTTTTAATTCTATAGC C CTT CATTCACATCTTTTTGAA 1430 

; TCCTTTCTGTT 14 95 

CT TTTTAGTCTATGGTACy\^^ 15 60 

AGTGATGACTCAAAGTTTCCAAGTGCA^ 1625 
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TGGTGTTTTATCTCAAAGTCATTTTT 1690 
AATGTAGGGTACATACTTTGATTTTTTTGATCCTGTATAAACAATGTAAGAATTTCCACAACTCA 1755 
TTATATTTCAAAGGCCCAACTTC^TAATTTCAACATTATATAATATATGGGAATATATAGATAT 182 0 
ACATGTATATATAATAATTTAGCCATGTTTCTATTGTT^ 1885 
TCCTTGTAACTCACTCTGCAATGAAGATTCAATAATTi^ 1950 
AGGATGGG CT TT T AAAAATGAAATT AAT GGGC CTAAGGATAAGAAC ATATT TTAAGATTTTT AAT 2015 
ACATGCTGCCAAATTGCTTTTCAGAAAAA 2 08 0 

GAGATTCCCTCTTTCTTATTGGCATTGCCTCTAAACACAACTTTGTTTTGTTTAATTCCTCTGAA 2145 
AGCCAGGGAGAAAGAACTATTCCCAGGTGGGATCTGACTATTCTGAACAGAGTGAGATGAGTATA 2210 
GCAGTTAACAGAATGGGCTCTAAGTCAGATGTTGGGGGTC C AAATCCAC CTTGGCC ACCTGTTGG 2275 
CTGTTTGACCOTAAGCAAGTCAACCTCTGGGC^ 2340 
TAAGAGTAGAACCTTCTT CAGAGGGATATT AAACATAACT CATAGGAAGTGCTTGGTATGTAGTA 2405 
GGTGTTCAATAAATGTTTATC^GCCAGGGTGCCCACAGAAAATATATGTCATATGCATTAGACAG 2470 
TTTGAAGGGATTTAAAT AAAGAAATGATTTAGAAAGATC CAAATGGGATGAGGTATACC CT 2535 
CTCATAAAGCCAGTTATCCTTACTACCTCTTGCCATAAAGGATTGAGAAAAGAATGTTATAGGAA 260 0 
CCCAGAGATAAAGAGGGAGGTTTAGAGATGGTTGTCAGACCATCCCAGAGGCATGGCCTTTGTAT 2 665 
GGCTGGGATTTAACCAGTACATGGAAGGAACTATAGGAATAAACACTCTTACCTCATTCTTTTGT 273 0 
TTCC CT CCTGTCTTCTGCTTGTGCTAC CATTTGGCCACAT C CGACTGGAAGTCAGAATAAAGGAG 2795 
AAGTCAGAATAAAGGAGAACTCCTTGATGCAGTAC^CATAGGTCAGCCAC^TCCTGGGGC^CTGG .2860 
GTAGGGTGGAGAAGCACAGAGTTTGGAAATGGAGGTGTCAACAGAAGCTCTCCAGCA 2925 
CT CCAGCTATCAGAACAGATATGATTCTT CTGTTAATACAGTCAAAT ATTAAACTAACTTCTTTT 2990 
TCCAGCGAGGTCATGCGATTAGTCCTGCGAACTAC^ 3 055 

TTGTGCTGCCACAAATACATATCTCTACATTGTACAGTTGTATTGGGCTGATTTTGCTTTCCCTT 312 0 
GGGTTTTGAGGGAAT CTAAGGGCAATACTTTTTACCTATC CCTTCATTTAATTATTT CAGTTCAT 3185 
CTTTCTACACTGCAGATATTCTCTTGAAGTCTGGTCTTTTCCTCACAGATTACTGCCATTTGCCC 3250 
ATTTGTTTACTATTCTGTAAAATCCTCATCCAATTAATTGAGAGATATTAAATACAGTTGAGCCC 3315 
TGTT CTTGTTACTACAAAACTTATTTC CAGTTGATATCTTTTATTGCTAAGATTGATCT CTTTTT 33 80 
TCAGTAAGTTACATTTAGATTTCTAAGGTCACTCATTACTATAATATATAGCTTGCTGACTGAAA 3445 
AATTTGTACCTTTGAAGGTAAGTGACACTGTGCCACTTTCCAGTTTTACTTTATATATTTCAGGT 3510 
CTCATTTAAAAATTTCTCGATTCCCAATTCTATTTTCTACCCATCACTGGATAGTGGTGTATTCT 3575 
TTTTCTCTTTGTTTCATCCATGTGTTCCAGGCCTAAAGGTAGGTTATTGGAACCCATCTGCCCAA 3640 
TGCTATGTGTATTGTGCCTGAAGGAAGACTTTCAACC CAT CTGTCCAATTTTACCACAT C CTAAA 3705 
GAAATCCCAACATGAAACAGATAATAAGACTAGTTAGTAAACAAACTTAATAGATTTGGACATTG 3770 
GCACAGAGTGCTGCCAGAGTATGCCTGCTATCTGATGCC^TTTGATCC^AGTCCCAACATTGTGG 3835 
AATTATATTTTTTGGTGATCCTGCTTTTTTTTTTTTTTCTTGAGATGGAGTTTTGCTCTTATTGC 3 900 
CCAGGCTGGAGTGCAGTGGCGCCATCTCAGCTCATTGCAACCTCTGCCTTCCAGTT 3 965 

TCTCCTGCCTCAGCCTCCCAAGTAGCTGGGATTATAGCTGCTCGCCACCATGCCTGGCTAATTTT 403 0 
TGTAGTTTTATTAGAGACAGGGTTTCACCATGTTGGCCAGGCTGGTCTTGAACTCCTGAACTCGT 4095 
GAT CCGCCTGC CTTGGC CTCC CAAAGTGCTGGGATTATAGGCATGAGC CACCATGCCCAGC CGGT 4160 
GGTCCTGCTTGTAAGGCAACTGGTGCTGGCAAGGGTATCAATGGACTTTTAATAGAGTTGAATC^ 4225 
TAGAATGCTAGAATTAGAAAGGAAGCTC^^GATCAAAGCTTTGCTTAGAGGGCCATAGCTGCATC 42 90 
AO^TGCCAAACTCAATTTCATTCTTCGTTC^ 43 55 

AGATAAGCTTAAAGAATTTC^CATGTGTGTCCATTCTTT^ 4420 
TGCCATGTGCCAAGTACCATGGGGGATACTGGGCATATAGAAACAGAAATCATGAACCTGAACTT 4485 
TCAAGAGGTGTCTCAATAAAATAGTGTGAGAAATGAGTAAAAAC^ 4 5 50 

TCCAACCTAGAGGGAGCTTAAAGATAAAGGAAGAGATGTGAACAGGTACATATTTTAGATGAGCA 4615 
TTATACTTTTAGGAAACTGTAGGGGATGGGTATGTCTGGATTGTAGGCTTTGTATGAAATGGTGG 4680 
TAGTAGATGAAGCACCTTGACCTGATATACTATGCCAAGGAGTTTGGATTTTCCTATGAAGGCAG 4745 

TGGGTAGTCACTGGATAGTTTTAAGCAAGGAAGTGAC^T 4810 
GTGCTGGAAGTGTAGAGAATGCACTTAAAAGGGACACAGTGAAAAGTGAGAAGCCTACTGAGATG 4875 
TTTCAGGAAAGAAATCGT CAGGGAGTGAAGTAAGGTACAGGAGTTAAAGAGTAAAGAATTAATTA 4940 
GAGAAG<^TTGAGGAGGTAAAAATCACTAGAACCTAGTGAGAATTTTGATCTGAGGCAAGGAAGA 5005 

GTTATTTGGGATATATCC7VGGGTTTCGGGTTGGGAGATCTC 5070 
GTGCCCTTTCC^TCCCTCATTAGTTGAATGGCCCTCGGCAAGTTATATGAACTAGCTGTGTCTCA 5135 
GTACT CTTATCTCCAAAGTAGAAATAATAATAGTACGTATTT CATAGAGTTTTTAAAAAAGTAAA 52 00 
TTAGTTAATGTTTATTAAAATGCTTGAACAATGTTGAGTATACAGTAAACTTTATACATTGGTTT 52 65 
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GT TAAGTAC C CAGAC TCATAAATTT CAAAGTTAGATTT CAGTGAAAGAT CT AAGTGAT AATAT CT 53 30 
AGAGAACAAGCAGATTTATGAATAAAGAAACCAGTGAGAGAGGTCTGCGCTAAATGTACATATTT 53 95 
GAGGATCATCAGCTCAAATGTGAAATTAAAAGTGTGAATAAAACTGGCCAAAC^GATT 5460 
TAGAAATTTTGAGGAGCGCAAGTCTTTGAAGGGTGGTAGAGGAAGCTGAGTTCAGGAAAAGAATG 5525 
AAAAAGAAACAGTTATATAGGTGGAAAGAAAATGAAATGACAGGAAAA.TAATATCTT 5590 
AGAGGCAATTTACAAGAGGAAGTAGTCAGTAATATGAGATACAGTGGAAATGGCAAAGAAAATAG 5655 
AAAAGAAAATTGGC CAT CTTATTCCAGCTTTTTGTTTTTTATAATGGCTGATAAATACAGTTTTG 5720 
ACACAAATTATTACTTTTCATGTAAAACAAA^ 5 7 85 

ACTTTTCATAAACTCAAT AC CATTTATCTATT CTTTAACAACTTCATTTTTTGGCTTTAGTATAT 5850 
AGCCTGAGGTGTCATTGAACATATTGAATTTCATGGTTGAAAATGAATAGTTGTCCATATTGAGT 5915 
CATGGCATCAAA,CCTTTATAGGATTGCTTTCATGAATAACTGGTTTTCTTT 5980 
AAATGAATAGAT CGATACTAAGGAGAAAAT AATT CCT CTGATATGGTGATTTT CCAAAGTTTCCT 6045 
TTGTAGATTTGTCCCTTCCTCCTTTACCTCCTCCCACCTCCCTCTTTCATTGAATGCCAACTCAG 6110 
TTTCAGGCA.TTCTTTCTGTCATTTGAATATTCCACAGTGAACAAGACATTCA 6175 
C C TGCTTGCATT ATT TTAT TGGGGGAAACAGACAATT AAATAGTAAAATAAATGAGGAAGATAAG 6240 
TTTAGATGGTAATACATTCTCTGAAAGAAATTAAATAGGAT^AAGTAATTAATGAGAGGTCCAGGT 63 05 
TGGATGCTGGCAACGATATGTTAGATAGTAAAGACCTTTCTAAC^^ .6370 
ATAGAGACAAGAAAAAGCTAGACCTGCGAAGACTTGAACAATAGGA^^ 6435 
TAGTGCAAAGGTCCCGAGGGAGAAATGTGCTTTGTGTGGTAGTCGTGAGGCAGAAAGGCAGCCCC 6500 
TGTAGCTAAAGAATAGTGAATAGTAGTGAGTTT ATAGTGAACGT CATGAGTTT CATGGGCTAGAT 65 65 
TTTGAGATATACAGTGTTGCTTTCTAAATGAGTCCAAATTATGCTGAGAATTGCTACTTATTGAT 663 0 
AGTCTCTTGAGTATGGCTTTAACAAGACAGAAATTAGCTTCATAAATATGGAAATTCCAGA 66 95 

TGAATTGTGATTTTAGTTTAGTAACTCATTGTA(^^TTTCTGGAAAATTCCCC?^TAGAAGATTC 67 60 
ATAACTGTGATGTTGCAAATCTCTGTGATTGTTTGAAACGTCTGTCTCGTTTTATTGGTAAGGAA 6825 
ACTGAAATCCAGAGAGATAATTGATTTGTTTCAAGGTCT CAGAGCTGACAAAAAACAGGACCAGG 68 90 
ACAAATGGCTGTTTTAGCTATCTTAAATAT CATCCTTCAAGCCTTTGC CCAAGGACTACCTTTAT 6955 
TATTTAATGGCAAAAACGA.CAATTACT TTTGCACCAACCTATATGAAGCCTCT CCTGT CT CCATG 702 0 
CAGTAGATTTCAGTTACCTTTC CTTCTGAT CCGTGCTAC TCATT CATGTTGC CATTACTGCATTC 70 85 
GGTAATGATATGAATAGCATGT TTTAATTAGTGTCCTAT CTCCATTATATGATAGACTTAAT CAG 7150 
AACATTTTATAACCCTAGTACCTACTGCATTATAGAATTCTGATAATATGCTGTTATGACTGACA 7215 
ATGTATATATAAGTGAATGGGCATGTTTAGGTTTGTCTTTCAGCTCACTGCCTTTTTCTTGGAAA 7280 
ACATTC AAT CTC CTTACACTTAAATGTCTACATCTGTGAGGAAGAAATTATGGTGTTAATGTTTA 7345 
AATGACTAG^TATATTTATCCCCTATGTGAAAGGAAAAAAGGAGTTACAAAAACAAATTTAAAA 7410 
AGTTGATGTGTTGTAGGATTCAAAGTATTTT CATTTTTACAATCTGTTAGAACAGGAAACTGACT 7475 
TAAAAATGT CC C CCACT CAAAGCTTGTTCAATAAACATTTGTTTGTTATTTGATTTAAATGTTTT 7540 
TTTAAACATATAAAAGCTTTGC CCATGAATAGCTGTCTGAGC C CATCCCTTTCATCAATGTCTC C 7605 
TCTTATATGAGACATTGTTCTGATGCTTTAAGAAATATGTTCCTTGTTGTTTTAGATATCAATGC 7670 
TGTTAACTTGTTATTGACCCAAACAGTCAACTCAATAAAGACTGTTTTAATATTGTACTTTTAAA 7735 
ACTGCAAATGAAAAATCTTCTTTTAATATTTTTAGAAGGACTTCAGATAGGGGTTACCAATAATA 78 00 
CATTTGTATTAATTATTAAAATAATATAAAATAAATATAGTATTTAAATATTATAAAATAATAAA 7865 
TTTATATAATTTTATAAAATTTATTTGTATTGTAAAAATACATTTTTGAAACACATATCCTAATG 7930 
GATATTTAAAGTTTAATAGAAACCTCCTTGATCCCTAGTCAACAAGATATGCCCCAACCATTGGT 7995 
ATCCCTGGGGACACAGGAGTTCATTGTTTCTTTGGCCTGTC^CAACCAGGTCACA 8060 
TCTAGTTGCTCAGTAATTAT CCTAGGCACT CGGGCTTTTATC CTAAAACTTGTCACATATTGTTT 8125 
TTCAGGGTCAGTGATGGGTATTTGT CAGCCCTGT CT CACATTTGTAGC CAGAAGCCTAAGGTCAT 8190 
CATTAGCACGTGCCTTTGATTGTCAGGAAACGAAGTACTAGGTATATGGAAGTTTCTTTCATTGC 8255 
TTCCATGATTGGGACTTTCTC^TCCTAAAGAAGAAGAAAAATCCATACACAGTTTATTGCCTTT 8320 
CAAACTGAC^TTCTGTAAGGCTCATTGGATGATTAAGTAATAAG 83 85 

AGCGTAGATTAAAACATATCCT CCAGCTTAAAGCCACAATAC CC^ 8450 
GCCAGAGAGAATCTTGTATGTGATGTTGATTTAAAAAAATATACAAAGTTAAAAAAGTATGTCCT 8515 
C CTT CAGATTTAACTATGATT AGAAAATGACACAAATACCCACATATGCAAT 8580 
GTGTACATAGATACCTGCAAAATAGATGGTTAGTTCAGTTTATTTAGATGCAGAGTTCCCTAATC 8645 
AAACTAACGGTTGTTTGATAAAATAAAAAGGTGACATAAAAGGGATGTGACTTTTGAAGCTGTTA 8710 
CTTATTTAACC^TTTAACCATTTGCTCCATTTAACCAGGAGCAAAAGTGTAAAACCTTTGCCC^ 8775 
TAGAGGTTCAGGAAACACTAAAACTCATTT CTGTGCTTGGAGAGT CCCTAATAAGGCTGGCAGC C 8840 
AACAGTTAAATAATACTTATTTCAAAATGATATTAAGAATAGAAAGATCTGTTTATTTTCTGATG 8 905 
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GATATTAGTTCT CTCACAACAT CACATTATC CTTAAATCTATATGTGTGTGTGTAGTTTTAATAT 8970 
ATTTTTTAAGCCAAACACT7^TACAAATAAATATTCTTCTGTCCTATTGGGACATCAGTTAGTCT 9035 
TTACTAAAGGCATOTGGAGTAATCATC 9100 
ACTGTACTTTTGATTCATGAATCCATA 9165 
ATTAAAATAATTAATCATATAAATTTATTAT^^ 9230 
TTAGGAAAGCTAGTGAATAAATGAATGAATGATTTTTTTTTTTAGTTAGAAAACTTACAGGAATG 92 95 
TTTCAGTTTAAGGTAAACTTTGTGTTTTCTGAAGTTCCTTGGGCTGGCGATTGAAATAAGTAGTC 93 60 
ACTTAATATTTTTGCTTTGAAATGTCTAGTGTCTAGCTAGTACTTTAGGAATTAGATATTACTTG 9425 
CTAGGAAGAGCTTGCCTTATTTTTTTAAGTTTTCAAATTTAAAGGTTAATTTTAAATAAGTGTGA 9490 
TACCTCCATGGTTACTATTACTGTTTTT 9555 
TTTTAAAAACATGTATTATGTACAGACACTGTGCCATATACTATTAGGATGGACTAAATCATTTA 9620 
ACCTCACAAAAAATGGATGCTATTATTGTGCCTATTTTATCATTGAGGAAGCTGAGGCTTAAAGA 9685 
AATGAGGTAATTTGCTCGACCTTATGGAGGAAGTTTTCAGAATTTTTGTACATTTTGCAAGTAGT 9750 
GAATGAATAACATATTTT CATGTTTATTTTAATATT CCATTAATTGAAAAATTGAGAGGCCTCAT 9815 
TAAAAATGAAAATTTGTTAGCCTGAATAAAATCACTTTATGAGGGGTTGGAC^TTATAATTTGAT 9880 
AATGCCTACTGATTTTTATAAC CAATTTTTATCTTACTGGACTGCAAGCCCCATTCTAC CCTACA 9945 
TTTATTTTCAGATGGAAT CAGTTCTACTGGAGAGGAATGTTTTAGGAATAAGCGAGT CAAATATA 10010 
CACTGGGAATTAAAAGCTAATTCAGAAAAAAATATGTGCTGCAATTTACTTGGTTGAGTGCTATT 10075 
TAC CAGCTTGGGTTTATATGATAGTAAGAAGGTTCTAGAGGCTCTGGTCTT CAGAAAATTGCTAT 10140 
TGCAGGGCATGAGAAAAATGGTTATGCTTTGGGTAGAAGCTCAACTTCCAAAGTAAACACCATTT 102 05 
AACCCACTTCTGAGGACAAGGGAAAAATGTACGAAATTTATTTTGGGGGTAATTTCTTTATCTTT 10270 
CATGTGCAGT CGTGATATTTATAGAGTTTTAAGATTAACT CAGATAAAAATACAAATTATATAAA 10335 
AATACAATTTGTTGCTTTGGATTCAGTGACTAGCACCTGGAAAATAGTATATTCAGAAGATGTGA 10400 
CTAAAAT TTTGGCCAGTTTCCCCTCTTTTGATCAACAAAACTCATTGAAGAGTATT CT CGGAACA 10465 
TAGTCATTTAACATATTTTTATTAATTGTGGAAAATGAC^CACATATAC^C^AATTTTATAAAA 10530 
TGAAAAATATATGCTTAATTAAACATTATAAATCCAGTCTACTGGATATGTAGTGAGATCTCATT 10595 
CTTGTTTTAATTTTTATTTCTTTTTTATGATATGATTGAGCATAGTAGAATGTATTTATTATTTA 10660 
TTTGAGAGTATCTTGTTTTGTGAAATAGCTGTTCTCTTACTCTTTTTTAATGATGAATGTACCTG 10725 
TTTTATATTGATTTAT CAAAGT CATTTATATATTTTGGAATGTATCTTGTGTTGGTTATAAGTAG 10790 
TACAAATGTCTTTTCCCACTCTGTGGCTTGCTTTTTTACTTTCTTTTTTTTTTTTCTTTGAGATG 10855 
GAGTCTTTCTCTGTCACCAGGCTGGAGTGCAGTGTGGTGCGATCTCGGCTCACTGCAACCTCCGC 1092 0 
AACTGGGATTCAAGCTATTCTCCTGCCTCAGCCTCTTGAGTAGCTGAGACTACAGGTGCGTCGCA 10985 
CCACGCCAAGCTAATTTTTGTATTTTTA 11050 
TAGATCTCTTGACCTTGTGATCTGCCTGCCTCGGCCTCCCAGAGTGCTGGGATTACAGGAATGAG 11115 
CCACCACATCTGGCTGCTTTTTTACTTTCTTAATGGTATTCTTTGATAATTGGAAAGATCTTTAA 11180 
TATAGCTCACTTTTGAAATTTTTTTATTATGAATTGTAAATTTTGATGGAACTATAGTCAGAAAA 11245 
CAAATGCTGTATAATTCCAATTTTTAAA 11310 
TTTTTTTAAATGTCTTGTGCAAGGTTTAAAAGAATGCGCATTCTTTGTGGGTCTAGTTTTCCATC 113 75 
TATGCCTGTTATGTGAAATATGCAAATTGC^ 11440 
TTTTTTAGCAACAGTTGTGTTGGCTTTAC TACAAGTATT ATAGGTATAT CCATTTGT C CTTGTAG 115 0 5 
TTCTGTTGATTTTTGCAGTATATATTTTTAAGCT ATAATGGTAGGTACATAAATGCTTAAAAGTT 11570 
GTAATTTACTGGTGAAATTAGTCTTTTATTACTAGGGGGTATTTTTCTTTATTCCAATTGTTTTC 1163 5 
TCCAGGAGGGTTGGTAAAAATTACCAAGTTAAACAT TT CTGGAATAAAATATCTTCAAATAAACT 11700 
CTGCTGGGAATACATAGTTTCTT CTTGCGCT CACTGAGAGAAGGAGGCAATCAGGTAAATGGCC C 11765 
TTACAGTATAGTTTTAGAAGTATTGT AGCAAAACATGGCATTCTGTGATAGC C CTTAGAAGGTCA 1183 0 
CTTAACCCAGACTTAGTTGAC^^GGGCATTTC<^ 11895 
TATGTAAGAGTTGGCCGTGACAAAAAGAGGAATGAAGGCAGAGGGGGGCAGA 11960 
ATGGTTGCTTGGGGACTTGTATGTTTCAGCTATTAAGTGTGTCAAAAAGTCTGGGAAGAAAGGAA 1202 5 
GGAGTTTAAAATGGACAAAAATATTTCTAATTGTTTGCTATTTCAAGGTGTTTTTAAATGTTGCC 12090 
AATTATAAATAAATAACACTGCAGTGGAGAACTTTGAGCATTATTCTTTGTCCTTGTCCCCTACT 12155 
AGTTCTTGAGGACAAGTTTCTTGAAGTAGAATT^ 1222 0 

CAAAAGGGGACATCTAATTCAAGATGATAGAAGGCTTT^ 12285 
TTTGAGGGATGAATCAGAGTTAGTXAAGATGAAGGTAAAACATAAATGCTGGGAAATCTCATGAG 12350 
CACAGAGGAGAGTGAGTTGAAGGAAGGGTAAATAATTTCTTACGGGTTGGCTTGGTACAAGGTCT 12415 
GGTGAGTCATGTTGACAGAGTGGGCTTAAGTGC^^CTAGGATTATACTTGATTCC^TCT^GA^ 1248 0 
CTTTAGTTAATAAAATAATGAAATGCCTTTTTTTCTTATTCTTACCTTTTGAAGTTCCTGGAACC 12545 



WO 03/062453 



10/501834 

PCT/US03/02038 



44/47 
Figure 13 - page 15 

CATTTGTACCATATTCCC CAAATAATTATAATGATTAT CTTT CATATGCCAGAACT CATTTT CTA 12610 
CCATCTCTCGAGGTGATTTTAGCATCTGGAACAC^ 12675 
TAAGTAATGCCTGCTTCCCTTTACTTCTTTTCTATTCCTCCATATCCACACGTCCTAGGATGGTA 12740 
CTTATTAAGTCTAAGGCCCAACTTCGCCATTTAACAGCTGTGTGATTCCTGACAAGCTACTTAAC 1280 5 
CTCTCTTTGCCTCAGTTTCCTGATCAGAACCTCAACTGTATT(^ 12870 
ATTGTGCATGTGAAAATATCCGGAATGTCTT 12 935 

TGAATACATAAATTTGCCCAGGTTTAATATGCCTCTTAGTATAGTTTAGAGAAGCTTTACAAAGG 13 000 
TAAACCAAGGATGAGCTGCGTATCCTGAGCATCTTCTGTCT CAGAGGTGGCTACCCT CATTTAGG 13 065 
GGCAAAGTCCA.CGCTGGAGAGAGC^CCTCACCTTTCTTTGATTGCTAGATTGAGAAGAAAATGAG 1313 0 
GATCTCAGCCTTTAAAGCTTTCCATTTAT CAGCTTTTACACATT CAAGAAGCATTTCATTTTTAT 13195 
GTTGCAATAGCATGTATTTCCTTCTCTTAGGTCACCTTTGCCTTCTTTGTACTTAGTCCCTATTC 13260 
TTCATCTTTCGTTTTCTCTCAGTTACAAAAAGGAAGCGAAATTCTG 1332 5 

TATCACGGCAGGCTAACTAATTTTGCCCAGACTTTCTGCGAAAGCTCCACATGTGCT 13 390 

GGGTTGCATAATTGATTTAATCTCTAATTTTAGAGGAACGCTGAACTCTTTTTGTGGGACTCTGC 13 455 
ATACATTTCTCTAGGGCAAAAACTGTCCTACTTTTTTCTCTCTGGTATCTCTTTAGTGCTAGGCC 13 52 0 
ACTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTCCCAAAGACTCTAAACTACCCTCCGTGAA 13 585 
ATAAAT GAAAT CACAGTTGGAAAACAGCTTAC TGGAGAGACT TGTAATGGGAAGATAACAGC T AC 13 650 
GCCATACAGA.TTTACTAAACATTTTCATCCTCCCCTGCTTCC 13 715 

TTATTTTCACTAAGATGATGGATGAGGCTCTCAGCTGAQjAGTC 13 78 0 

AACACACCTTTGCATATTATTGGAAATACATAGGCTTGCTCACCCATTGACCTACTATATGCCTC 13 845 
TAGGCAGATTTACTTACCTGTCTGAATCTTGCTTGCTTTCAGCAGAGTACTAGAGTAATGGCTGT 13 910 
GAAGGCTGAACTATAAAAATAGGTATGTAGCAAGCTTTAGACTTACCTTGTGCCTTTTGGCTATC 13 97 5 
CAGGTATATAGG&AGTGTCAGCAAGGGGGGATGATTTT^ 14 04 0 

ATGAAAACCAGGCAATTGTAAGTTTACTAGTTATTTCACATTGTATTTAGCAATGTGATTTTTGG 14105 
TTAT CTTTTCGGGAATTTATATACTGGGAAGTCGCATTTGAT AGC CGGTGGTTTTTATTAACCTG 14170 
T CTGATTTGGAATATAATTTTGGGATTAC CTT CC CACCAGTTACTTCTCAAACAACTGACTTTAA 14235 
TAACTTTAGTATTTTTGTACTCTAAGACATATGTTCCATTGAAACTAACCTTCCTCAGGTCCATA 1430 0 
CTCACTAACGCTAATTTGACAAATTCC CTGAACAATTCTCATAC CAT AGAAGTATGAATTTTC AT 14365 
ACCAAACTC CACTGTTAACAT CAATAAAATTAGGTCAGAAAGAATTC CAACTGCTGTCTGAGTAT 1443 0 
C AT AGCCTTATGTCTTTATGAGT CTTTATGCTGCTAAAAGAATTTAGTTTTAGAAAATAACCTCT 14495 
TATCTGTTAAATAAACACTTAGCATAAACAGATCTGTGTTCAAATAGATTCTGTTACTTAATAGT 14560 
TGGATCAATTTAGACAAGTCCCTTAACCTGTAAGCCTCTTTATGTGCAAATATTTAAAACTGGGA 14625 
TAATAATTATACTGACTTCTCAGGTTTGTTGTGAGGAGTAAATGCTAAAATGCATATAAAGAGAT 14690 
TTGAAGGTTATCTAGCCATAGACAGTGTATCAGGCAGGTTTTGCCATAATAATGGTGTGTAACAA 14755 
TCCC CAAAT CTCAGTGGTTTACAT CAAGAAATATTTGTGTTAGACTTAGTTGAACTTGGCTCCAG 1482 0 
CTTGTGCATTCTATTCAGGTTTGCTCTGCATATCTCTTCATTCAGATACCACAGGCTATTTAAGA 1488 5 
AATTCTGTATTCATGGTAGAGAACAACATTGAAAGAGATCTGGTAAAAAATGAAATAAAACAAAA 14950 
CAAAAC^UVCTTGCCAAGTCCCTTAAAGCATCAACTGAAAACTAATATTCCTACC^ 15 015 

AATTTCATTGGTGAAAGCAAGTCATATGACCAGGATAAATATTAGT^ 15 08 0 

TGC CCTAATAAAGAAAGAAGAGTGAATACCTGGTGAATAATACATGAGTCTC CT TCAAAGAAGTT 1514 5 
TACTGAATCTTTTTTATCCTACTCTTATTTCATCTGCATGACCATTGACTCCTCCATATAGTCTA 15210 
CTTCACAGTATCTACATTGCATTATTGAAATTATACTGCAATTTCTCCCTCTCTTTCTTTTAATT 15275 
TCAAATTGATTTGAATGATATACTTTTCTTTGTAAACAG 15314 (SEQ ID NO: 2 18) 

Intron 61 

GTAAGTACTAATTATATTCACATCCAAATGAGGGCTGATTTTTTAGGTCCATATTGACATATGTT 65 

GCAAATGT CAATCTACTTACACTGAATCATATAACTCAT CTGCTTTTTAAGATAAGAATAAAAAT 130 

TCAAAGAGTCATTTAAAGAOTTAAATTCTTAGTTTTTAGATTCTATATTA 195 

TGATTATTCTATTTCCAAGGTGGTAGAAAACATTATATTTTGATTCCTTAAGGTGAAAAGCATGT 2 60 

AGGAAGAGATATTTTTGAAGCAACTTGTTTTTAGTTCATTTGATTGTTTATTTATTTATTTAATG 325 

AATTTAAGCAATGGGCTAGGTT CTAGGGTTGGTAAAGTGAAATAGATGTTATT CTGTTGCTACTG 390 

CTATATCATTTTATTTGTGATAGTGCTAATAAGCTATTAGTATTTAATGGGTAGTGACTACTTCT 455 

ATACAACC^TCTCCAGTGAATGTGGAATTTGGTAGAACTTAAAT^^ 520 

AACCACGT C CT CACACTTGGAGAAATATTGAGCTAATACATTGATTGTC^ 585 

AACATATCG^GTGAAAGTTTAGCTAGTGTTTTTGTGTTTATAATAGAGATGGATGTTCCTCTTT 650 

CCTGTTATACATTGATATATAAAGAGGATGAGAAAAAATGCAAGCAAATTTTTCTGGATCTGGTT 715 
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GATTTAAGGCCTTTGGGAATTGra 780 
AATTTATTCAGTTTTGGATATTT^ 8 4 5 

AATATTGTGTATGGTGGTATGAGAATTAGAATGCTTAAAGAAATGATGCTGATGCATCTTAGCTT 910 
ACATTGAAATATCTTTCCTTTTGCCCAATTTTATTTAGATCCCACTGAGTTCTTGTAAGTATATT 975 
ATAAGTATACATACATGAATAATTTTTGTCTAGAGAGAAAGAGAGTCAGTTTAT 1040 
ATTTAGATTTTACAGTACTGAGCTTTCTAATAGGTCGTAATTCCAAAATGACTGATTTTATATTA 1105 
TATATAAAAGACGACTCAGTTAATATTGTGCTTTTAACTAGAAACAGAGAAAAGTCAATGAGTAG 1170 
AAG CAAT AGAGGTACAT C AGAAGAAAAC CAGCAGAGAGTGGATC CAGCACAAGTTT AGAT AT ATA 1235 
GACACATATATGTGGGGCATGCCATTCTATCATGAGGAAGTGAAACAGCTTGAGAGAAAAG 13 00 

CTTTTATTTATCACCCACCATTTGTCATAGCC^TCATGTTTTTTTACTTTTGACTCAGTTATTTC 1365 
TGATTTAATAAGAAACAGTTCAAAGTGTATAATATAGCATTGATTTTGTGTTGGAATGTGTTCTA 1430 
TCCGCCTATCTCTCTCTCTTTTTCTTTAGCATTTTAAAAGACATTTTCTAGACATAAGGCAAAGA 1495 
GTAAATCTTCTGAAGATAAAGAAGGGCTGCTTCTTAAGTATGTCTGAACA/^ATTTCTCCCGAATA 1560 
AGAAATGC CATATCCTATGGCATTCAATGAGAATTAGCAAGGTTT CTCATGTTTTCTAGTGTTGC 1625 
ACAGTATGATAAAAAACCAAACCAAAATGAAA.CAAAACCCTAAAGCCCGACACAGTCTCCAGAGC 1690 
C^GCCTTGTTTCTTTCAGCTTTGATCAC^GTCAGTTGGGTCTTC<^TTGAACTCACTGGAGAGCC 1755 
ATTGACGAGCC CATGAACTGACCTTAAGCCAGCAGAAATGAGTCTAGGAATGCAGTT CTTTCTTT 182 0 
TTTTTTTTTTTATTATTATTATACTTTAAGTTTTTTCATGGAAAAGTACCAAGGATGTTCTCCAG 1885 
TGGTTTGCTCTCGTTAATTTAATGAGCTTATATGCATTTCAACAAATTCAGGCCATACTGGACAC 1950 
ATTTTTCTAAGAGAGTACTAGCTACTTTCAAAAGCTACCAACTTTGGGCCAGGCGTGATGGCTCA 2015 
CACCTGTAATCTCAGCACTTTGGGAGGTGGAGGTAGGTGGATAGCTTGAGCGCAGGAGTTTGAGA 2080 
CCAGCCTAGGCAACATGGTGAAACCCCGTCTCTACAAAAACACAAAAATTAGCTGGATGTGATGG 2145 
TGCATGCCTGTAGTCCCAGCTACTTGGAAGGCTGAGGTGGATTGTTTTAGCCTGGGAGAGAGAGG 2210 
TTGCAATGAGCTGAGATTATGCCACTACACACCAGCCTGGGTGACAGAGCCAGATACTGTCTTAA 22 75 
AAAAAAAAAAAAAGAAAGAAAAGCTATAAGCTACCAACTCTGTTTTGTGGGAAGAAACGGAGTAG 2340 
CCAT CTACT TTTAAAGTAAATAATACACAGTGAACTAGC CTCTTCTGGTCTTTC T CTAGAGGCAT 2405 
CTGGATTCAAGCATCCTCTGCTTAGCTAAGTTTCCATCACCATGTTTTCCAACTTCCAAAACTTT 2470 
GTTGATCTCTGTTGTCATTTGTTGTCTTCTTGCATGTGGCATGGTGGTTTGCTGCACCTATCAAC 2535 
CTGCCATCTAGGTTTTCAGCCCCACATGCGTTAGGTATTTGTCCTAATGCTCTCCCTTCCCTTGC 2600 
TCCCCACCCGTCAACAGGCCCCGGTGTGTGATGTTCCCCTCACTGTGTCCATGTATTGTCATTAT 2665 
TCAACTCCCACTTATGAGTGAGAACATGCGGTGTTTGGTTTTCTGTTCCTGTGTTAGTTTGCTGA 273 0 
GAATGATGGCTTCCAGCTTTGTCCTTGTCTCTGCAAAGGGCATGAACTGATTCTTTTTTATGACT 2795 
' GCATAGCATTC CATGGTGTATATGTGCCACATTTCTTTATCCAGT CTATCATTGATGGGCATTTG 28 60 
GGTTGGTT C CAAGTCTTTGCTATTGTGAATAGTGCTGCAATAAACATATGTGTGCATGTGTCTTT 2925 
ATAGTAGAATGATTTATAAATAATCCTTTGGGT ATATC C CCAGTAGTGGGATTGCTGAGTCAAAT 2990 
GGTATTTCTTGTTCTAGATCCTTGAGGAAT CGCCACACTCTCTT C CACAATGGTTGAACTAATTT 3 055 
ACACTCCCACCAACAGTGTAAAAGTGTTCCTATTTCTCCA<^ 3120 
CTGACTTTTTAATAATTGCCTTTCTGACTGGCATGAGATAGTATCTCATTGTGGTTTTTCAGGGA 3185 
CCTCAATTCTGTAGTCATAGGAAATGCATTCTTCCAACAACCTGTTTGGAAGTGAACTCTTCAGT 3250 
AAACCCAGCCAAGCCTGTCTGGACTCCTGGCCCACTCCCTGGAGATAACACATTTGTGTTACTGT 3315 
AAGCCACTGACTGTGGTAATTTGTTATACAGCAATAGAAAGTAATATGGCATATCACATAAAGCT 33 80 
CTTTGTTTGTGACATTGCCATGAATTTTGGGCCATGAAAACAGTTACTGTGAGGGTGAGCATGAC 3445 
ACTGTGGGAGTGTGTGTCTGGGTGTGTGCAATGTGTATATACTTATCATATTAGTAGCTTTTTAA 3510 
GTT C CC C CATT CTGC ATAAGGAGCAC C CTATCAGGTTGCTTTGGAATAGAGAAGAAAACCAGGAA 3575 
AGCC^VTCAATTATACT^GTCTTTTGGCATTGAGTaVCCTTTAGCATTTTCTCTTCTGCATCTTC 3640 
TCCTCTTTATGTATCCTGGGCACCTGCTTTCTAGAAGAGAGCTGTTTGGAGCATGAAAGAGTAGA 3 705 
ATCTTTCTATCAGCAAGGAAGTATGTT CTTTTCCAGACCGGCAGAATGTT CAT CCTAGAAGAGAT 3770 
TCCTATATTGCCAGCTTGTCTCTTTTCTTCCCTATGACAAAAATCACAACTTTGCCATTAAAGAG 3835 
TGTTTTTACATCATTTCTTCTTTTCACTACAGTACAAATTCACTACTTTGTTTAATTGGGTCGAT 3 900 
GGCAAAATTATTGTAATCTTATTTCATATGTGTGGCTTTGTGGGAAAGTGAGATGTTCTACGTAA 3 965 
GCAAGCTTTCCATACAATTAAAAATTGTTCCATTAATAACAA 403 0 

TTAATCGTTAAAAAAAGACA7VAGATTGCATAATACCCAGGCTTATTCAATGGGAAATAATGTAGA 4095 
CTGTTCACATTTGTTATGACGATTCATGGTCATCATTAAATCTGT CATTTACTTCACAAT CCTGT 4160 
TTTTGCTGTGATGCC CTTGGGTACTATTTTTCGTATACTGAATGGTGCCAGAC CACTAAATCTTT 4225 
AGTTCTTGTCCTGCGGTTTGTATTTTTTCTGCTATTTTGCTGTGAAAAGGATGCTAATTGTAATC 4290 
TATTGTATTTTTTTTTTTGCTATTTTGCTATGAAAAGGATGCTAATTGTAATCTATTGTTGCTGT 4355 
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TGACATAT CCACAT C CAGAAAAGTT CTAAGT C CAAAAT CAGACGACACT AACT TAAAAT CAATTA 442 0 
ATTTAAGAATTATTTGTACACATAGTGAACTCATAGGTAAAT^ 4 4 85 

ATGCGAATGTTTTTTATTCCC CAGTGTTAACCGAACAGCTATTATGTTCAAAATAT C ATATGGT C 4550 
C CTATAAGAAT CT AGAGAT TTGAAAATTAATGGATATGAAAAACAACATTTATT CAACT ATTTAA 4615 
TGAGAAGATGTTATACTAAATCTCATTCCGTATCTATTACAAATAAATCATTAATTCTCTATGAA 468 0 
GCTGCTTAGC CATTAATC CAGTTTTTTGTAACATTAACTTGAGTATAAAATGTTAAT CTTTATAA 4745 
AATTTATTAGGTGGTCAAGGTTTCGACTTATGATTATATTCTCAAG^^ 4810 
AATCACAATAAATTATCATTCAATATATCACATACAGTGAAAGGTAGCCTGTTTTACTTTTCTAC 4 8 7 5 
TATTCTAAAACTCCTGTGCAACCAATATCTTGAATTAAATCTCTTCCATTAGAAAGACCTTGAGT 4 94 0 
GATTTCTGTTTTCCTGTACAGACTTATGAOTGCTAGAGCTCCCCAGGCTAAACAGGAAAATTTC 5005 
TTATTTTGCGTATGGTCTTTAAAAATGCAGAGTTTTCATTCTCCTAGATAAAATACTCATGCTAG 5070 
ATTTATTATAAAATCTTGTTTTAAATGATTTACCAATTAAAATACTTAGGTTTTTGTCCCCTGAT 513 5 
TTTTGCTTATAATTGATTTTACTTATCTTTCATTGTCCTTGTGCCCTGTTAAACCCACCTAGGCT 520 0 
TACTTAACAGCTAGTCAACTC CTAAGAGGTGTAGTTGTCCC CTGAATTGTTGGAAGATGTACCGT 5265 
GTTTATTCTGTGTCTTTATATACTTCTGATCCACTGCAAGTTATACCTAAGGTTACTGGAATCTC 533 0 
ATTTTTAAATGAATAATTCCATGGAATCACAAGAGTTTAATCAGAAGTATCACAGAATAGAAGTA 53 95 
AGCACACTGCTTGAGGAGTGCCCCAGAATGTGAAGTTGAAGGCAAAGATGAGTGGTAGTTTTTCA 546 0 
GAGGC^TTAGTGACCTAAGAACAGAGGGGATGCATAGTAGGTACTGATTTGGCAAGTGTTACTA 552 5 
TAACAACATGTACTGGGTGCTTACAACATGCGAGGCTTGGAACTAC^^ 559 0 

AAAAC CGTCAGAT CATAAGACATTTCTTC CCTCTTAGGAATTGGCTATTTGCTAAGAAAGC CTAG 5655 
ATAGGCTTAAAAGGGAG<^TGAGGACCATGAAAG 572 0 

ATAACCAGAAAAGTCATTCTTGTCATACAAAGTATACAGAAGGTTATTCTTGAGGGGGAGAGATC 5 785 
ACAGTGTTCTATATCTTTGCATATCT CACAGTGC CTTGAACAACATTTGTACATAGTAGAAGGGT 585 0 
TAACATATACTTGTTAACTATATAGAAATATGTTGATATTAGATTTGCATTTTCCCTGTATATAA 5915 
ACATAATATATTTAATTTAGAATTCTTTAGAATTGACTAAAGAATTTACTTTTTTCTTTCAGAGT 598 0 
ACAAAATTGTCCAAAATCATTTTATATTTCAAGTCCCCTTGTGGCACATATAGAATATTTGGCCT 6045 
TAT CTAGCCTATTTAAAAGAAGAGAGATAGGC CGGGCGCGGTGGCT CACGCCTGTAATC CCAGCA 6110 
CTTTGGGAGGCCGAGGCGGGCGGATCACGAGGTCAGGAGATCGAGACCATCCCGGCTAAAACGGT 6175 
GAAACCCCGTCTCTACTAAAAATACAAAAAATTAGCCGGGCGTAGTGGCGGGCGCCTGTAGTCCC 624 0 
AGCTACTTGGGAGGCTGAGGCAGGAGAATGGCGTGAACCCGGGAGGCGGAGCTTGCAGTGAGCCG 63 05 
AGATCCCGCCACTGCACTCCAGCCTGGGCGACAGAGCGAGACTCCGTCTCAAAAAAAAAAAAA^ 6370 
AAAAAAAAAAAAAAAAAAACAAGAGAGAT AAAAAATG CT C AGGACAT CATGAAGCATTC AATCAA 6435 
AACATGAGGCTTTTTATAGGAACTCGGCTTAGTAGCTTTGAGAAGAAGGTTGAAGAGAGAGTATC 6500 
TCTGATTTCCACC C CAACTTCACCTCAC CCCACCACAGTAGGTCTTGTTGAGAGC CAGTTTTCAC 6565 
TAATAAAACTTACTTGCTTTCTGAGTTTTCCATGCAAATAGAAATAATTCCATCTTCTACAG 663 0 

AAACATTT CAGATCTGGTGGAAT CGAAAAGCAAGAATAATGACATGAATAGGAGTGATCTCTTAA 6695 
TTGGGAAATTTCTGTATTTTCTTGACTTTTCTCCTATAGCCTGCATTTAAGCATTGCAGAAAAAA 6760 
AAATCTCTCACATACCTAACTGGGTATTGGAAGCTATTAAATAATGGTAAAAACTGGGATGAATG 6825 
GAGGGAACTTTTCTCCCCCATTTTTTAAAGTTTGGCTGTAGGTCCTTCTGCCTGCAGGCTACAGT 6890 
CACATTAGCAGTTGGAAATTGGATAACGACAGCACAATGACAAATCCAGGTTGC 6955 
TGCTAATCCCTTTGCTTTAATATTGGAGCAGCATGTAATGATGTTTGGACATCACTCCAGTTTAC 7020 
TGACGACC C CACTGGGGCCAGCAATAGAACCTTACAACTGT CTAACAAGGCATCAGGTGACT C CC 7 085 

. (JTCGTCACAGCAACGGACACT^ 7150 
TAGATTATATAAGTGGCCCATCATTGCTTGGTAACTTGAATCAATTAACGTTAATTCGCACAA 7215 

. CTATGATGTATTGTGATCACTTT CATTT CAGGGAAGGGGGAGAAATTGCTATAAGTCACCTAAAA 7280 
TGAGGTTGTCTGTGGTGCTGAGGTATTAATTGGGTGTCCATATTAAATGCAAAAGGAGCCCATCA 7345 
TGAAAGGAAAGTGGATGAGTGACTCTCTTGGCTGCTATTGACCTATCAGAAGAAGACAGTGCCCT 7410 
TTTC CTTTGCTTTTATCTATTACAGTTTT CC CTATTGCGTGTCAAGTTGATGTATTATAAAAAAT 7475 
TGATTTGATGACCTTTGACC^^ 7540 

. GACCCT 7605 

-ATTGCACTATTATAACATATCGTAAAAAACA 7670 
G.CTTAAGAGTTTATGTGGAGCTTAAAGTGGTATTACCTTGGGATATGCTGCAGCAGCAAGTCTGT 7735 
GACCTCCAGTGAGATGCTGTTTAGATTT 78 00 

GTGAGGAATGGACCTTTTAGCGGGTGTTCAGGCAGTTGGTTTCCCTCTCTTCGTCTCAAGACGTC 7865 

AlATGTACTTATGTGAGAATCTTTGATGGGGT CTTTCAGT CTCTTTAACC CAGACTGCTTGCCTGC 7930 
ATCCTAGG CCCTAT CAGAAAGAATTTAAGGAAAAGGTTAGGGGAGAAATAGGATCTGATAACAAC 7995 
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ATTAGAATTTTCTAATAACCTGG^ 8060 
CTGGTTTAAATTGTTCCCTTTAAAAAAGGAAAGAAGCCCTAGCCACTCAGGCTAAACAAACTAAG 8125 
AAATGATGATGGGGCTAGTGTGAGTTGAATTCC CAGGGAGTGATTC CAGC CAAAAAGCCAGGGTC 8190 
TTAGCTGGTAGATGACTAAAGAGCTTCTTAGGACCACATGTTTGCACTCTGCCCGCATTTCCTAG 8255 
GATTCCCAGGGGAGAAGAAAATTGCTTCCTATGGAAACTTCATATTTAGTGATCCATTGTATTTG 8320 
CTCTTCCACTATTTCCTCTTTCAGAACAAATCTTCACTTTTTCCTGACATGCACCCTCCATATTA 8385 
AATAAATACTTTATCCTTTCCTCCTCACGTGGGGAAGGGGAGGTGGTTAGGAAATAGAATAGTTG 8450 
ACTTACATTTAATGGGAGAAAGCAAAGTAGGCTACTTTAAAAATAAATAAATAAATAAATACCTC 8515 
ATGAGACCTGGC CTAGGCTATTGAGGATAACT CACCAAGGGTTGCTCTATGTCAGGGTC CCATAT 8 5 8 0 
ATATGTGATGTCCAGGTGTCTGCATTTAGTTGCCAAACATCTGTTGCATGCCTATGATATGTAAT 8645 
TCACAATAGGCTTAATGGGACAATAGGTATATAATTTTATTTTAATGAAGC^ 8710 
AAAATACCGAAACTCTGAGTGAAATATGTTTTACACTGTCATGAATTATGTAACTATTTTCTATG 8775 
TATTCCATTTTGTTGCTAAGTCATGTCAGCACTTAACATGTTCAAAGGAACTAAGAAGTAATATA 8840 
GGTCATTGGTTAACCACTCTAGATCTTGGTCAACACTTACTATTTGTAGGACCTTTGGCAAGTTA 8905 
TTTAAGCCTTTTTGGACCTCAGTTTCTTCATATATAAATAAGAGTACCTACCACATAGTGTCATT 8970 
TTAAAGATGCAATGAATTTATATATGAACACTTTATCATGGAACTTGGTATATAGTATGTGCTCA 9035 
GTAAATATCAATT CTAAATATTATTCT C CT GAGATGCTTCATGCAACTGAAGTAAATTAATT CAT 9100 
TAATGCTATTAATAGTTATTGAATCCATTTAGTACAAACACACTCGGAAAATATAAATATGGCTT 9165 
GTTGTGAAGATTAAATGAGCTATT CTGTGTAAACAGTGGTGTACTGGAGTTTGCTGTTGGGCAT C 923 0 
TCTTCCCAGCT CTGCTCAGTGATATTAT CTTGTCAT CT CAGAATTAGCTATGTTGGTGGTATTTA 9295 
TATCACAGAATTGGAACACATCCACAAATCAGGGCATTATTTGGGAAGCTGATTTAATAGCTTAC 93 60 
TATTGGACGTGTCCATGTCCTGTCATTTTAGTCTGAGGCTTTTATTATTATTATCTATATTAGTC 9425 
TGAGGCTAATTTTCACTGAGGCTTTTATTTTTTGGCTGATTTTAATAAATGATGATAAAAATATA 9490 
TGCT CATAATTTGTGATTTTCCCTAC CC C C TAGT CCAT TTTCATTATAGCTAAGAAAAC ATATCA 9555 
AATACATACAGAATTAACCTTTGCTATAAAGCCATGTTCk^ 962 0 

ACACAGGCAAATGCAAATATTTTCACTGGTAATAATGGATTGTGGAAAATTGCTACCATAGGGA 9685 
ATGTGTAATCCTAAGGATGTATTTTGTTTGTTTTTATAT CTGT CAG 9731 (SEQ ID NO: 219) 



